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مقدمة 

تطور علم المعلوماتية منذ بدايته في منتصف القرن العشرين حتى بداية هذا القرن بشكل 
متسارع وكبير وتشعبت فروعه وتعددت مجالاته واختصاصاته. وأصبح دخول هذا العلم 
ضرورياً في مختلف مجالات الحياة وكافة فروع العلوم الأخرى واقتضى ذلك تصميم 
الخوارزميات الملائمة لحل المسائل والمشكلات المطروحة إلى تطوير كبير في علم 
الخوارزميات. واقتضت بنية الحواسيب التي رافق ظهورها ولادة علم المعلوماتية إلى 
وضع خوارزميات تتفذ تتابعيأً بحيث تكون تعليمات البرامج مرتبة ترتيباً دقيقاً ويتم تنفيذها 
الواحدة تلو الأخرى؛ إلا أنه مع زيادة حجم المسائل الواجب حلها وتشعب المشكلات 
الواقعية المطروحة وصعوبتها أصبح من العسير على مثل هذه الخوارزميات الوصسول 
لحل دقيق لتلك المسائل والمشكلات إما لتجاوز قدرات السذاكرات اللازمة لتخزين 
المعلومات والنتائج المرحلية أو بسبب المدد الزمنية الكبيرة اللازمة للوصول للحل الأمثل 
وعلاوة على ذلك أزداد إلحاح مستخدمي الحواسيب في طلب قدرات حسابية متتامية وذلك 
بشكل مستمر الأمر الذي حدا بالعلماء والباحثين للتفكير في إيجاد أساليب جديدة تساعد 
على تلبية تلك الرغبات سواء في تسريع عملية البحث عن حلول للمسائل المطروحة أو 
زيادة حجم تلك المسائل. 

في البرمجة إلا أنه تبين استحالة تطبيقها على الأجهمزة 
التقليدية التي تعتمد تقنية الكترونية ثابتة › الأمر الذي استدعى التدخل في بنية الجهاز 
نفسه والبحث عن بنية جديدة وقد تم في مطلع الثمائينات من القرن العشرين تصميم أول 
حاسوب متعدد المعالجات دعي ۴.1 ۴ الذي احتوى على معالجين يعملان في آن 
معا وتوالى بعد ذلك ظهور حواسيب جديدة تعتصد بنى مختلفة مشل ,88۶ ,5۸۴ 
ye 05, ...‏ ,11111۷ وكان القاسم المشترك بين مختلف هذه البنى هو استخدام 
عدة معالجات في الحاسوب الواحدء وعلى الرغم من الإمكانات الهائلة التي تقدمها هذه 
الأجهزة سواء في قدرتها الكبيرة في الحساب أو في حجم الذاكرات الكبير جداء إلا أن 
ظهورها قد طرح مشكلة أساسية هي عدم المحافظة على التسلسل الزمني لتتفيذ التعليمات 
والعمليات مما استدعى تطوير خوارزميات دعيت بالمتوازية لتتلاءم مع الواقع الجديد 
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الذي فرضته هذه الحواسيب فظهرت خوارزميات متوازية لكل من الأنواع العديدة 
للحواسيب المتوازية. 

ا لأهمية هذا الموضوع في الثقدم الحاصل في استخدام المعلوماتية بوصفها الأداء 
المفضلة في كافة المجالات فقد رغبت بالمساهمة في دراسته لعلي أقدم مساهمة آمل أن 
تكون ذات فائدة على كافة الأصعدة. 

ويمكن اعتبار الأهداف الرئيسية لهذا العمل: 

1- عرض مفاهيم الخوارزميات المتوازية. 

2- تطوير مفهوم الخوارزميات والمعالجة المتوازية وتطوير إمكائية تطبيق الخوارزميات 
المتوازية في معالجة الأنظمة التطبيقية. 
تقع الرسالة في ثلاثة فصول: 

٠‏ خصص الفصل الأول لدراسة مفهوم الأنظمة متعددة المعالجات وتعريفها وتصنيفها 
ودراسة أسلوب التواصل فيما بينهاء ويتضمن هذا الفصل تعريف تعددية المهسام 
وتعريف الأنظمة متعددة المعالجات ومن ثم وصفها وتصنيفهاء وبعد التعرف على 
أنواع الحواسيب تبعاً للتعليمات وتحكمها بالبيانات نتعرف على أسلوب الاتصال 
بين وحدات المعالجة في هذه الأنظمة ونتحدث عنها بالتفصيل. كما أننا نقدم أفكاراً 
ونتائج تشكل أساسات نظرية الحساب المتوازي ونوضح بعض نماذج الحساب 
المتوازي. كما نتحدث عن الدارات المنطقية التي تعتبر نموذجاً مصغراً عن 
الحساب المتوازي وتعتبر مقياسأً لكلفة التوازي فهي تشكل قاعدة لدراسة تعقيد 
الحسابات المتوازية. 

ه٠‏ خصص الفصل الثاني لدراسة الخوارزميات المتوازية وأنواعها وتمييز خواصها 
وتقنيات تصميمها ومقاييس تحليلها وتحديد كفاءتهاء ويتضمن هذا الفصل مقدمة 
عن الخوارزميات المتوازية وتعريفاً لها ومن ثم تحليل الخوارزميات المتوازية 
وتحديد المعايير الخاصة بذلك وبعدها نقوم بشرح بعضا مسن تقنياث تصميم 
الخوارزميات المتوازية والتسلسلية وأخيرأً نحدد خواص الخوارزميات المتوازية. 

٠‏ خصص الفصل الثالث لدراسة خوارزميات متوازية لحل بعمض المسائل على 
أجهزة متعددة المعالجات» ويتضمن هذا الفصل شرحا مفصلاً لخوارزميات متوازية 
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على نماذج مختلفة من الحواسيب متعددة المعالجات ومن ثم تحليلها وذكر خواصها 
ومقارنتها بالخوارزميات التسلسلية للمسألة. إضافة إلى عرض بعض تطبيقات 
الخوارزميات المتوازية مثل مسألة حقيبة الظهر ومسألة المجاميع البادئة ومسالة 
الأعمال التسلسلية وفق فترات انتهائها كما نبين فيما بعد الخوارزميات المختلفة 
لمسائل رياضية شهيرة على أشكال مختلفة من الأجهزة متعددة المعالجات ونسذكر 
الأمثلة التوضيحية الموافقة لكل منها. 

كما تحتوي الرسالة على ملحق يتضمن البرامج الحاسوبية لبعض الخوارزميات إضافة 

لعرض بعض الأمثلة التوضيحية لعملها. 

وقد توخيت البساطة في العرض مع المحافظة على الدقة العلميةء كما أني أسقطت إثات 

بعض النظريات التي لا مناص من ذكرها حفاظاً على التسلسل المنطقي في عرض المادة 

العلمية وفهمها. 

وإني أرجو الله أن أكون قد وفقت في معالجة هذا الموضوع وقدمت مساهمة بسيطة في 

تطوير جانبا مهما من جوانب علم المعلوماتية. 

وأسأل الله العون إنه نعم المولى ونعم النصير. 
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الفصل الأول 


دراسة مفهوم الأنظمة متعددة 
المعالجات وتعريفها وتصنيفها ودراسة 
أسلوب التواصل فيما بينها 
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1-1 مفهوم البرمجة متعددة المهام: 
1-11 تعريف النظم المعتمدة على الحاسوب: 


تعرف النظم المعتمدة على الحاسوب بأنها مجموعة أو ترتيب عناصر نظمت بغية إنجاز هدف محدد 
بمعالجة المعلومات. ويستخدم النظام المعتمد على الحاسوب عدداأً من العناصر وهسي: البرمجيسات 
والعتاديات والأشخاص وقاعدة المعطيات والوثائق والإجراءات. وتضم هذه العناصر بأشكال مختلفة 
لتحويل المعلومات. 


ولإنشاء نماذج لهذه النظم نقوم بما يلي: 


ه تعريف الإجرائيات التي تخدم احتياجات الرؤية المعينة 

٠‏ تمثيل سلوك الإجرائيات والاقفتراضات التي يستند إليها هذا السلوك 

٠ه‏ تعريف الدخل الخارجي والدخل الداخلي للنموذج بشكل وأاضح 

ه تمثيل جميع الروابط (بما فيها الخرج) التي تساعد المهندس على فهم الرؤية فهماً أفضل. 


ولبناء نموذج نظام يجب على المهندس التقيد بالعوامل التالية: 


1“ الافتراضات: التي تخفض عدد التبادلات والاختلافات الممكنة والتي تسمح من ثم للنموذج أن 
يعكس المشكلة على وجه مقبول. 

2- التبسيطات: التي تسمح بإنشاء النموذج بالوقت المتاسب. 

3- الحدود: التي تساعد في وضع حدود للنظام. 

4- القيود: التي توجه الطريقة التي يُنشأ بها النموذج والمنهج المتبع في تنجيزه. 

5~ التفضيلات التي تدل على البنيانات المفضلة لجميع المعطيات والوظائف والتقانة. 


قد يترتب على نموذج النظام الناتج حل تام الأتمتة أو نصف مؤتمت أو يدوي. ويمكن وصف نمساذج 
لكل نمط يحقق حلا بديلا للمسألة المطروحة وببساطة يتم تعديل التأثير النسبي لعناصر النظام المختلفة 
(الأشخاص والعتاديات والبرمجيات) بغية اسنتتاج نماذج من كل نمط. 
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2-11 تعريف تعددية المهام: 


تعرف تعددية المهام (عہن)یھ انا u‏ )على أنها قدرة نظام التشغيل على تتنفيذ أكثر من مهمة واحدة 
في الوقت نفسه وتتيح د تعددية المهام مثلا تنفيذ عدة برامج د مختلفة والطباعة على الطابعة والتخزين 
على القرص في الوقت نفسه ودون انتظار انتهاء كل مهمة من هذه المهمات قبل تتفيذ الأخرى. 


وتبنى الخوارزمية في الأجهزة المتعددة المعالجات على أساس تعددية المهام والتنفيذ المتزامن حيث 
تتولى كل وحدة معالجة مسألة جزئية فتقوم بمعالجتها بشكل متزامن مع الوحدات الأخرى ونحصل في 
النهاية على النتيجة بجمع تلك النتائج المتعددة والحصول على الحل النهائي للمسألة. وتعتمد البرمجة 
المتعددة المهام على فهم طريقة تتفيذ التعليمات على البيانات حيث إن هناك سلسلة من التعليمات تأمر 
الحاسب بوظيفته في كل خطوة وهناك سلسلة من البيانات (دخل الخوارزمية) ستتأثر بثلك التعليمات. 


ويتم تصنيف الحواسيب تبعا لطريقة تنفيذ التعليمات على البيانات وتتم برمجة كل نوع من أنسواع 
الحواسيب باستخدام خوارزمية إما تسلسلية وإما متوازية كل على حسب ما يوفر من إمكانيات. كما أنه 
من الضروري وجود اتصال بين وحدات المعالجة بعضها مع بعض خلال الحساب وذلك من أجل 
تغيير البيانات أو النتائج ويتحقق هذا الاتصال عن طريق الذاكرة المشتركة للنظام أو عن طريق شبكة 
الاتصالات بين وحدات المعالجة. 


2-1 الأنظمة المتعددة المعالجات: 
1-2-1 وصف الأنظمة المتعددة المعالجات: 


لقد وجدت الأنظمة المتعددة المعالجات من أجل تحسين الفعاليات وذلك مقارنة بالكلفة والموثوقية 
والتكيّف ويعتبر النظام المتعدد المعالجات (مع أو بدون تواز) رائدا بين أنظمة المعلوماتية حيث ينافس 
نظام المعالج الوحيد وينافس أيضاً الأنظمة الموزعة وغيرها. 


وفي النظام المتعدد المعالجات المتوازي يوجد العديد من وحدات المعالجة المستقفلة والتي تتف 
بذاكرات محلية وتشترك معا بذاكرة رئيسية وتكون هذه المعالجات متزامتة. حيث يحوي الحاسب 
المتوازي عدة معالجات ويقوم بإعطاء مسالة جزئية من المساألة الكلية لكل منها وتحل المسائل الجزئية 
بشكل متزامن كل واحدة في معالج مختلف ومن ثم تجمع النتائج لإعطاء حل المسألة الأصلية. 
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يتکون أي حاسب سواء تسلسلي أو متواز من تعليمات تنفذ على البيانات: حيث تأمر سلمسلة من 
التعليمات الحاسب بما سيقوم به في كل خطوة › وتتأثر سلسلة بيانات (وهي دخل الخوارزمية) بثلك 
التعليمات. 


نستطيع أن نميز بين أربعة أنواع من الحواسيب: 
1- أولا: حواسيب S150‏ ( سلسلة تعليمات مغردةء سلسلة بيانات مغردة): 

Single Instruction stream, Single Data stream(SISD) 
وهي حواسيب تعلمية - تعليمية حيث يتكون الحاسب في هذه الفئة من وحدة معالجة مفردة تتلققى‎ 
سلسلة تعليمات مفردة. تصدر وحدة التحكم تعليمة واحدة تطبقها على عنصر البيانات الذي تحصل‎ 


عليه من وحدة الذاكرة. نستخدم لبرمجة حاسب من هذه الفثة خوارزمية تسلسسلية أو تتابعيسة. 
[SeGA-1989]‏ 106۹ 


2- ثانياً: حواسيب 1180 (سلسلة تعليمات متعددة - سلسلة بيانات مفردة): 
Multiple Instruction stream, Single Data stream (MISD)‏ 


يوجد في هذا النوع من الحواسيب ١‏ معالجأً كل منها يملك وحدة تحكم خاصة به ويتقاسم وحدة الذاكرة 
المشتركة حيث توجد البيانات. يصل في كل خطوة عنصر واحد من البيانات من الذاكرة ويتم العمل به 
من قبل جميع المعالجات بآن واحد كل حسب التعليمة التي وصلت إليه من وحدة تحكمه الخاصة. 
يتحقق التوازي هنا بجعل المعالجات تعمل عدة أشياء مختلفة في الوقت نفسه على عنصر البيانات نفسه 
وهذا النوع من الحواسيب يساعد نفسه بشكل طبيعي من أجل الحسابات التي تتطلب إدخالاً ليصبح مادة 
لعمليات متعددة فيتلقى كل منها الإدخال بالشكل الأصلي.[6۸-1989ء؟] 


مثال 1 -1: 


إن الحل المعروف لهذه المسألة هو تجريب جميع احتمالات قاسم العدد 7Z‏ : فإذا لم ينجح أي منها في 
القسمة على 7 عندها يكون أولياً وإلا فإنه يكون مركباً أو غير أولي. 

تكمن الفكرة هنا في تقسيم العمل في اختبار القواسم الممكنة بين المعالجات. حيث تأخذ كل المعالجات 
Z‏ على أنه إدخال ومن ثم يحاول كل منها تقسيم العدد على القواسم المحتملة المساعدة الموجودة عنده 
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ويناقش قاعدة الخرج المخصصة على النتيجة. وهكذا يمكن تحديد ما إذا كان 7 أولياً بخطوة واحدة. 
أما إذا كان لدينا عدد قليل من المعالجات أقل من القواسم المحتملة فإن كل من المعالجات يستطيع 
إنجاز العمل في اختبار مجموعة فرعية مختلفة من القواسم. 


3- ثالثاً: حواسيب 5|9 (سلسلة تعليمات مفردة - سلسلة بيانات متعددة): 
Single Instruction stream, Multiple Data stream (SIMD)‏ 


يتكون الحاسب المتوازي في هذه الفئة من N‏ معالجاً متماثلاً كل واحد منها يمتلك ذاكرته المحلية 
الخاصة والتي يمكن أن يخزن فيها البرنامج والبيانات. تعمل كل المعالجات تحت تحكم سلسلة تعليمات 
مفردة تمت معالجتها في وحدة التحكم المركزية. وبشكل مكافئ فإنه من المفترض أن تمتلك كل مسن 
ال N‏ معالج نسخا متطابقة من البرنامج المفرد. وتخزن كل نسخة برنامج في الذاكرة المحلية لكل 
معالج وهناك أيضاً لكل معالج × سلسلة بيانات. تعمل المعالجات بشكل متزامن » حيث تتفذ كل 
a‏ أو طرح عددين) أو 
تعليمة معقدة مركبة (مثل دمج قا I O E E‏ 
[رقماً واحدا) أو مركباً (عدة أرقام). 


ربما يكون ضروريا في بعض الأحيان أن نملك مجموعة فرعية فقط من المعالجات تقوم بتتفيذ تعليمة 
ما ويمكن أن نرمز هذه المعلومات في التعليمة نفسها فنخبر المعالج ما إذا كان عليه أن يكون فعالً 
(وينفذ التعليمة) أو غير فعال (وينتظر من أجل أن يتلقى التعليمة التالية). 


في معظم المسائل الهامة التي نحلها باستخدام حواسيب من هذا النوع يكون من المسستحب أن تكون 
المعالجات قادرة على الاتصال مع بعضها خلال الحساب من أجل تغيير البيانات أو النتائج المكررة. 
ونحقق هذا الاتصال وفقا لفئتين فرعيتين: إحداهما يكون الاتصال فيها عن طريق الذاكرة المشتركة 
والأخرى عن طريق شبكة الاتصالات. 


: Shared-Memory بذاکرة ترك‎ (SM) SIMD حواسيب‎ )1-3( 


تعرف هذه الفئة أيضاً بآلة الوصول العشوائي المتوjlزي‏ gaiذج The Parallel Random (PRAM)‏ 
Access Machine‏ . 

يتم تقاسم الذاكرة المشتركة هنا والتي يستخدمها مجموعة من لناس بنفس الطريقة » عندما يريد معالجان 
الاتصال فإنهما يعملان خلال الذاكرة المشتركة . لنفترض أن المعالج 1 يرغب بتمرير قيمة للمعالح زيستم 
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هذا بخطوتين: الأولى يكتب المعالج 1 الرقم في قسم الذاكرة في موقع معروف من قبل المعالج زوالذي 
يقرؤه بدوره من ذلك الموقع. 

خلال تنفيذ خوارزمية التوازي فإن أل N‏ معالج تصل إلى الذاكرة المشتركة لقراءة البيانات المدخلة من 
أجل قراءة أو كتابة النتائج المكررة ومن أجل كتابة لنتائج النهائية. يسمح النموذج الأساسي لجميع 
المعالجات بالوصول إلى الذاكرة المشتركة بنفس الوقت وذلك إذا كانت مواقع الذاكرة المحددة ممن أجل 
القراءة منها أو الكتابة فيها مخئلفة. 

من ناحية أخرى يمكن أن نقسم فئة الحواسيب هذه إلى أربع فئات فرعية وفقاً لقدرة اشين أو أكشر من 
المعالجات على الوصول إلى موقع الذاكرة نفسه وبنفس الوقت وذلك كما يلي: 


Exclusive-Read, Exclusive-Write (EREW) SM SIMD Computers (1-1-3) 

في هذا لنوع يكون لوصول لى مواقع الذاكرة محدودا بمعنى له لا سمح لمعالجين لقراءة من لموقع نضه مسن 
الذلكرة أو لكتابة في الموقع نفسه من لذلكرة وذلك في لوقت نفسه. 

Concurrent-Read, Exclusive-Write (CREW) SM SIMD (2-1-3) 
Computers. 

يسمح هذا النوع من الحواسيب بالقراءة المتعددة للمعالجات من نفس موقع الذاكرة ولكن من أجل الكتابة فإنه 
يبقى محدودا أي أنه لا يسمح لمعالجين بالكتابة في نفس موقع الذاكرة بالوقت نفسه. 

Exclusive-Read, Concurrent-Write  (ERCW) SM SIMD (3-1-3) 
Computers. 

يسمح هذا انوع من الحواسيب بالكتابة المتعددة المعالجات في نفس موقع الذاكرة ولكن الوصول من أجل 
لقراءة يبقى محدودا إذ أنه لا يمكن لمعالجين القراءة من نفس الموقع من الذاكرة في الوقت نضسه. 


Concurrent-Read, Concurrent-Write (CRCW) SM SIMD (4-1-3) 
Computers. 


في هذا النوع من الحواسيب تتحقق ميزة القراءة المتعددة المتداخلة والكتابسة المتعددة للمعالجات 
المتعددة. 
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إن خاصية القراءة المتعددة والوصول إلى تفس الموقع من الذاكرة لن يؤدي إلى أية مشاكل حيث أن 
كل من المعالجات التي تقراً من ذلك الموقع تصنع نسخة من محتويات الموقع وتخزنها في ذاكرتها 
المحلية الخاصة ولكن المصاعب تظهر عند الوصول للكتابة المتعددة . فإذا حاولت عدة معالجات أن 
تخزن بيانات مختلفة في عنوان محدد بنفس الوقت فأي منها سينجح؟ وبمعنى آخر حتماً سيكون هناك 
طريقة لتحديد محتويات ذلك العنوان بعد عملية الكتابة. 


مثال 2-1: 


ليكن لدينا ملف كبير جداً يتألف من ١‏ إدخال منفصل وسنفترض للسهولة أن الملف غير مرتب باي 
طريقة. والمطلوب تحديد فيما إذا كان العنصر × موجود في الملف أم لا من أجل إنجاز عملية قاعدة 
بيانات قياسية مئل القراءة والتعديل والحذف. 


في حواسيب ©8189 التقليدية مثلا تكون عملية استعادة × مطلوبة ۸ مرة في أسوأً الحالات حيث يوجد 
في كل خطوة مقارنة بين × وإدخال الملف. وتكون الحالة الأسواً عندما يكون × مساوياً لآخر إإخال 
أو غير مساوي لأي إدخال. ويصبح العمل أقل جودة بشكل متوسط كما يلي: إذا كانت إدخالات الملف 
موزعة بانتظام على المجال المعطى عندها تطلّب نصف الخطوات العديدة لاستعادة × وهو العمل الذي 
نستطيع القيام به بشكل اسر ع على حواسيب EREW SM SIMD‏ مع N‏ معالج حيٹ: .N<n‏ 


لترمز للمعالجات 4—وPi,P2,.,P‏ 


نحتاج من أجل جعل جميع المعالجات تعرف قيمة × في البداية إلى استعمال تعليمة النشر أو الإعلان 
BROUDCASTING‏ كما یلي: 


1“ م يقرأ × ویبلغ رم 
2- بنفس الوقت دط,رم تبلغ بط,رم على التوالي 
3“ بنفس الوقت وط,رط,دص,رط تبلغ و6,”,۲م,وص على التوالي 


تستمر هذه العملية حتى تحصل جميع المعالجات على × حيث يتضاعف عدد المعالجات في كل 
مرحلة. يتطلب إعلان × إلى ١۸‏ عه! خطوة. 


10 


All Riehts Reserved - Library of University of Jordan - Center of Thesis Deposit 


ليكن الملف الذي نبحث فيه عن × مقسم إلى ملفات جزئية يتم فيها البحث من قبل المعالجات بنفس 
الوقت:م يبحث في العنصر 1/N‏ الأول وهكذا.. 


يما أن جميع الملفات الجزئية لها نفس الحجم فإننا سنحتاج إلى 1/١‏ خطوة في أسواً الأحوال للإجابة 
عن استفسار × وبالنتيجة ومن أجل ذلك نتطلب الخوارزمية المتوازية ×/ + ۸N‏ عه!] خطوة في أسواً 
الأحوال. لذأخذ موقع ۴ يملك قيمة منطقية يحدد جانباً في الذاكرة المشتركة ويشير إلى أن أحد 
المعالجات قد وجد العنصر المطلوب وبالتالي فإن جميع المعالجات الأخرى تنهي عملها. مبدثياً تأخذ f‏ 
القيمة عءآه؟ وعندما يجد المعالح × في ملفه الجزئي يضع في ؟ قيمة عبم). 


في كل خطوة من البحث تفحص جميع المعالجاتٽ قيمة ٤‏ فإذا كانت عدم) تتوقف. 


نلاحظ أن هذا التعديل لم يأت بالسهولة فنحن بحاجة إلى N‏ ع٠1‏ خطوة للإعلان عن قيمة ۴ في كل 
مرة تحتاجها المعالجات. أي إلى × عه] "/١×‏ + × ها خطوة في أسوأً الأحوال. ولكي نستغل هذه 
النثيجة بدون زيادة زمن التنفيذ فإننا بحاجة إلى استعمال نماذج أكثر قوة تدعى حواسيب €CR۸٤۷‏ 
.SM SMD‏ بما أن عمليات القراءة المتعددة مسموحة فإنها تأخذ خطوة واحدة لجميع المعالجات لكي 
تحصل على × وخطوة واحدة لتقرأً ۴ في كل مرة تحتاجها. وهذا يقودنا إلى أن الحالة الأسواً تأخسذ 
n/N‏ خطوة. 


ربما يمثل الملف قاعدة بيانات نصية مع مئات الآلاف من البنود والفقرات كل منها يشمل عسدة آلاف 
من الكلماتء وربما يكون ضرورياً البحث في مثل هذا الملف عن كلمة محددة × وهنا فإتنا قد نجد 
أكثر من إدخال واحد مساوي لقيمة × ومن ثم أكثر من معالج يحتاج إبلاغ النجاح في نفس الوقت وهذا 
يعني أن اثنين أو أكثر من المعالجاث ستحاول الكتابة في الموقع ؟ في الوقت نفسه وهذا الشيء ممكن 
فقط في .CRCW SM SIMD‏ 


(2-3) حواسیب S115‏ شبكة اتصالات: 


يمكننا الحصول على نموذج مرن أكثر قوة من نموذج الذاكرة المشتركة يكون فيه كل زوج مسن 
المعالجات متصل بخط ثنائي الاتجاه » حيث يمكن لعدة أزوج أن تتصل بآن واحد (ولكن بشرط ألا 
يحاول أكثر من معالح إرسال البيانات إلى معالج آخر أو تلقي البيانات من معالج آخر). 

وبالتالي فإنه من المحتمل أن تستطيع جميع المعالجات أن تكون مشغولة بالاتصال جميع الوقت وهذا 
غير ممكن في ذاكرة مشتركة مقسمة إلى مقاطع yإ0‏ "۳ع" ٣e4‏ 2ط kءهاا-R۸‏ عندما يكکون عسدد 
المعالجات N‏ أكبر من عدد المقاطع ۴ . 
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(1-2-3) خصائص حواسيب 5110 شبكة اتصالات: 


1- الكلفة ([السعر): إذا كان السؤال المطروح : ما هو السعر المدقوع من أجل شبكة اتصالات 
تامة ب N‏ معالج ؟ هناك )N-1(‏ خط مسموح لكل معالج ومنه لدينا بشكل كامل ×N)۸-1(/2‏ خط. 
من الواضح أن مثل هذه الشبكة يكون سعرها غالي جدأ وبشكل خاص من أجل قيمة كبيرة ل .×N‏ 
وهذا صحيح على الأخص إذا لاحظنا أنه مع N‏ معالج فإن أفضل ما يمكن من أجل N‏ ملف تخفيض 
عدد الخطوات المطلوبة في الخوارزمية التسلسلية. 

:F eas: الوثوقية‎ -2 

حتى لو استطعنا تحمل مثل هذا السعر العالي فإن النموذج غير واقعي عمليأً مرة ثانية من أجل قيمة 
كبيرة ل . بالإضافة إلى أنه هناك حد لعدد الخطوط التي يمكن وصلها للمعالج وهذا الحد يفرضه 
3- العلاقة بالنىرذچ :SM S1M[5‏ 

أخيراً من الملاحظ أن نموذج الاتصالات اتام" أضعف من حاسب بذاكرة مشتركة من أجل نفس 
السبب . مثلأً في الذاكرة المشتركة المقسمة إلى ۸ مقطع لا يستطيع أكثر من معالج واحد الوصول 
المحدد بآن واحد إلى مقطع الذاكرة بالمساعدة مع معالج آخر. وهذا يؤدي إلى كلفة مماظة تقريباً لكلفة 
حاسب 812 85M‏ (ولكن دون أن نحسب الكلفة من الدرجة الثانية لطرق ثنائية الاتجاه). وهذا يحبط 
غرضنا الأصلي في الحصول على آلة عملية أكثر. 


(2-2-3) الشبكات البسيطة لحواسيب :S1MN[‏ 


من حسن الحظ أنه في معظم التطبيقات هناك مجموعة جزئية صغيرة من جميع الارتباطات 
(الاتصالات) المزدوجة تكفي غالبا للحصول على أداء جيد. 

سنلخص بإيجاز الشبكات الأكثر شيوعاأً منها فيما يلي: 

لنفترض أن لدينا معالجين يستطيعان الاتصال بعدد ثابت من الخطوات في حاسب 8M S15‏ . إن 
أي حاسب 8152 بشبكة اتصالات يمكن أن يُحاكى على نموذج سابق بدون أن يحتاج خطوات أكثر 
من الخطوات المطلوبة لإيجادها كما في السابق . 


نموذج الاتصالات التام: تتوزع في هذا النموذج مواقع الذاكرة المشتركة ال 1 بين × معالجاً » كل منها يتلقى 
M/N‏ موقعاً. إضافة إلى أن كل زوج من المعالجات تتصل فيما بينها بخط ثدائي الاتجاه. 
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:Linear Array مصفوف خط‎ -1 


یمکن تمثیل وصل N‏ معالج يشكل مصفوفة وحيدة البعد كما يظهر في الشكل (1-1) من أجل .N=6‏ 
هنا المعالج ۲ مرتبط بمجاوريه ر.۴ و ٣‏ من خلال خط اتصال ثنائي الاتجاه. 
کل من معالجاث الثهاية و المسماة PP‏ و ہو۴ تملك فقط مجاور واحد. 


شكل (1-1) شبكة خطية من أجل 6=× 


:Tow-Dimensional Array لبږد‎ ıl مصفوفة‎ -2 


نحصل على شبكة ثنائية البعد بترتيب ال N‏ معالج في مصفوفة "×٥١‏ حيث "×= ٣‏ كما يظهر 
الشكل(2-1) من أجل 4=:: المعالج في السطر ز والعمود ) يرمز بس ربنم حيث: 1-ص>)>0 
وا-صكإك0 . هناك خط ثائي الاتجاه یربط ریم بمجاوريسه (1-نP P+‏ وۆ+نP‏ نص . 
تملك المعالجات في الحدود الفاصلة للأسطر و الأعمدة عدد اقل من أربع مجاورات وبالتالي اتصالات 
أقل. 

تعرف هذه الشبكة أيضاً ب طععص عطا. 

نلاحظ أنه في كل من المصفوفتين أحادية البعد وثنائية البعد تملك الشبكة خاصية مهمة: وهي أن جميع 
الخطوط في الشبكة تملك نفس الطول وهي غير موجودة في الاتصالات الأخرى التي سندرسها. 
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3 2 1 0 رقم ادود 


شكل2-1 شبكة اتصالات بمصفوفة ثنائية البعد (شبكية) 
من أجل 4ك" 
3“ شجرة ال7lصJli Tree Connection‏ 


تكون المعالجات في هذه الشبكة بشكل شجرة ثثنائية تامة ومثل هذه الشجرة تملك ل مستوى مرقمة من 
0 إلى 1-ل و N=2“-1‏ وينتهي كل من تلك بمعالج كما يظهر الشكل (3-1) من أجل 4حل. 
كل معالج في المسثوى 1 يتصل بخط ثثنائي الاتجاه بسلفه في المستوى 11 ويتصل بخلفه في المستوى 


1-1 . المعالج الجذر في المستوى 1-ل لا يملك سلفا وكل من الأوراق في المستوى(0) لا يملك خلفاً أو 
أوراقاً. 
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قلستو ى3 
الجذر 


شكل (3-1) شبكة اتصالات شجرية من أجل 4=ل 
4- الاتصالات المختلطة تام :Perfect shuffle connection‏ 
ليكن لدينا × معالج .بر۴,..,د۴,۴,ر متوفرة حيث × هي قوة ل 2 )N=27(:‏ 
يوجد في الاتصالات المختلطة التامة خط وحيد الاتجاه یربط ;۴ ب ز۴ حيث: 


2i من أجل‎ 0<=[1<=N/2 -1, 


2i+1-N من أجل‎ N2 <=1<=Nl , 


كما يُظهر الشكل(4-1) من أجل ١×=8‏ 
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شكل (4-1) شبكة اتصالات مختلطة تامة من أجل N١N=8‏ 


بشكل مكافئ نحصل على التمثيل الثنائي ل إ بتغيير دوري ل ¡ موضع واحد إلى اليسار ويوضح 


جدول 1-1 يبين الاتصالات لشبكة مختلطة ثامة من أجل ١×N=8‏ 


بالإضافة إلى أنه في بعض الأحيان تضاف إلى الشبكة خطوط ثنائية الاتجاه تصل كل معالج إلى الذي 
خلفه بشكل دوري على شكل ثائيات في المثال: 


(2,3()0,1)ء(6,7()4,5) ٿم (3,4()1,2)+(5,6( 


وتدعی هذه الارتباطات بالارتباطات المتغيرة وهي تظهر كخطوط مقطعة في الشكل(4-1). وفي هذه 
الحالة تعرف الشبكة بالارتباطات المتغيرة المختلطة. 


:Cube Connection ۂيبيغگتلl الإتصالات‎ -5 


لنفترض أن ؟N=2‏ من أجل بعض ٩<1‏ ولتکن ال × معالج: ...ود۳ ۴,م۴ مكعب من 4 بعد أو 
(eطuءاpeرh)‏ نحصل عليه بوصل كل معالج إلى 4 مجاور. 


وهذا موضح في الجدول (2-1) لقيم ¡ وز دليلي المعالجين المتجاورين حيث 3= والفهسرس ل 
7...,مم معطى في مجموعة رموز ثائية. 
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اا ل 
O01 | 010 | 100 |‏ |000 ___ 
O1 | 101 |‏ | 000 | 001___ 
Ol | 110 |‏ 000_| 010 __ 


جدول 2-1 يوضح التمثيل الثنائي لقيم أدلة المعالجات المتجاورة في شبكة اتصالات تكعيبية حبث 
3= و N=8‏ 


شكل 5-1 شبكة اتصالات تكعيبية من أجل N١×N=8‏ 


4- حواسيب 15| (سلسلة تعليمات متعددة - سلسلة بيانات متعددة): 
Multiple Instruction stream, Multiple Data stream (MIMD)‏ 


تعتبر هذه الفئة من الحواسيب الأكثر عموماً والأكثر قوة في مخطط الحساب المتوازي الذي يحدد فيما 
إذا كان التعدد في سلاسل التعليمات و/أو سلاسل البيانات» وفي هذه الحالة لدينا ١١‏ معالج ول١‏ سلسلة 
تعليمات و سلسلة بيانات. يكون لكل معالج وحدة تحكم خاصة به بالإضافة إلى ذاكرته المحليية 
الخاصة ووحدة منطقية وحسابية. وهذا يجعل هذه المعالجات أكثر قوة من المعالجات المستعملة في 
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حواسيب .51M0‏ يعمل كل معالج تحت تحكم سلسلة تعليمات موجهة إليه من وحدة تحكمه لذلك تنفذ 
المعالجات جميعها برامج مختلفة على بيانات مختلفة وتحل مسائل جزئية مختلفة من مسألة وحيدة وهذا 
يعني أن المعالجات تعمل بشكل متزامن. 


تتجز الاتصالات بين المعالجات كما في حواسيب 81۷2 من خلال الذاكرة المشتركة أو شبكة 
الاتصالات. تعرف حواسيب [M2‏ التي تتشارك في الذاكرة المشثركة ب 0۲ءوعع0إم1) اام أو 
machines)‏ edاcoup‏ yآhtعti)‏ ويمكن تقسيمها حسب إمكائية القراءة المتعددة من الذاكرة أو الكتابة 
المتعددة في الذاكرة إلى الأصناف التالة من lgallسڍپ: EREW, CREW, ERCW, CRCW‏ 
SM MÎM‏ ؛ كما تعسرف الحواسسيب التي نتشارك من خلال شبكة الاتصالات ب 
coupled machines) gİ multicomputers‏ yا00seا)‏ وتشیر هذه في بعض الأحيان إلى الأنظمة 
الموز عة.[1989- 4 6GءS]‏ 


2-2-1 وصف الأجهزة المتوازية: 


كما رأينا أن الأجهزة المتوازية تقسم إلى فئتين هامتين تبعأً لطريقة الاتصال بين وحدات المعالجة وذلك 
إما عن طريق الذاكرة المشتركة المقطعة إلى مقاطع )ءه‌[طاء أو عن طريق شبكة الاتصالات. 

وتجدر الإشارة هنا إلى أن بعضا من الفئات الجزئية التي سبق ذكرها يتصف بتواز عام أكثر دقة على 
مستوى التعليمات الأولية نفسها مثل جهاز يدعى ها۴ ماه( حيث ننفذ كافة التعليمات على التوازي 
بعد أن يتم حساب معطياتها. 

ويمكن تمثيل التصنيف السابق بالمخطط الاآتي الذي يمثل تصنيف حواسيب S11‏ وبشكل مشابه 
یکون تصنیف حواسیب .51N[5‏ 


ايب SM SIMD‏ حو اسیب 5115 شبکة اتصالات 


التصبيقف حسب طربقة اتال المعانجات 
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التصنيف حسب الوصول إلى الذاكرة من أجل القراءة و الكتابة 


3-2-1 جھاز ۷-۶ CORA‏ متعدد المعالجات: 


يتكون جهاز ۸۸۷-۸۷۴ من أربعة معالجات شعاعية خطية أنبوبية بذاكرة مشتركة ويستخدم 
التوازي العام 1M‏ والتوازي المحلي [M8.31,1998¦.S10‏ 


1-البنية العامة لجهاز :C۸A¥-)M‏ 


يقم العمل المنجز على هذا الجهاز إلى مهمات تنفذها عدة معالجات في آن معا ويعمل كل معالج 
على المهمة المخصصة له بشكل تتابعي كما يستطيع الوصول للذاكرة الرئيسية عبر المسارات 
المخصصة له » حيث يخصص لكل معالج مسارين للقراءة ومسار للكتابة وآخر للإدخال والإخراج 
(عن طريق معالج خاص) ولا توجد أية حماية أو مزامنة ضمنية للذاكرة المركزية. كما يحوي 
على معالج داخلي مهمته إدارة الاتصالات بين المعالجات. ويجب أن نأخذ بعين الاعتبار في 
مستوى البرمجة صراع المعالجات للوصول إلى الذاكرة. 


لتأخذ الآن بعض الصفات الرقمية لجهاز ۷-2 :C۸۸‏ 


1. تستطيع المعالجات إنجاز عمليات شعأعية وسلمية. 

2. تمتاز الذاكرة المشتركة بأنها من حجم كبير وتبلغ استطاعتها(456 435 268) كلمة › E‏ 
کل کلمة ٤اط‏ 4 مقسمة إلى كتل مستقلة ولكل كتلة مدخلها الخاص بغية زيادة سرعة التدفق 
للذاكرة. 
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3. تبلغ مدة الدورة الأساسية في جهاز C)۸4۸۷-×۸۴2‏ وم 4.1 وتنتج العمليات الشعاعية نتيجة 
في كل دورة في حين أنه يجب علينا من أجل الحسابات الأخرى أن نأخذ بعين الاعتبار دورة 
فعلية معادلة لدورئين أساسيتين. 

4. يؤمن المحيط البرمجي لجياز CK۸۸ ۷-×۸N۴2‏ بواسسطة مترجمین: المترجم ۴12] 
والمترجم الجدید C۴۲77‏ كما أن نظام الاستثمار المعتمد هو ن¡ۈظlم UNIX SYSTE‏ 
.VATT‏ 


2- جھاز CRA ¥-XMP‏ كآلة شعاعية: 


يمتلك جهاز ۸۷۴×-۸۷ K۸‏ بصفته جهازأ شعاعيا تعليمات شعاعية تكون خطية أنبوبية : أي تقسم 
التعليمات لمهمات عنصرية ينفذ كل منها عامل متخصص. ويمكن مقارنة الخط الأنبوبي بخط تجميسع 
السلع حيث تمر السلعة على عدة مراكز عمل وعندما يزود الخط بالمواد الضرورية فإن السلع الجاهزة 
تخرج من الخط في كل دقيقة بالرغم من أن تصنيعها يحتاج لعدة ساعات. تستخدم التعليمات الشعاعية 
سجلات شعاعية يتكون كل منها من 64 كلمة » طول كل كلمة 64 خانة. 


ومما تجدر الإشارة إليه أن أول أجهزة C۸۸۷‏ قد ظهرت في عام 1985 وكان الجهاز مكونا من 
معالجين. ومنذ ذلك التاريخ تم تطوير هذه الأجهزة. ففي السادس والعشرين من آذار 1997 ابتدأ في 
مركز الحساب العلمي التابع لمفوضية الطاقة الذرية في غرونوبل باستخدام الحاسوب الجديد الموازي 
61-۴۸٤‏ الذي يتميز بسعته الكبيرة. لهذا الحاسوب 256 معالجاً ويعمل بتردد 375 ميغا 
هرتز ولكل معالج منها ذاكرته الخاصةء ويستطيع العمل بمغرده إلا أن شبكة ربط عالية الأداء تتيح 
لها الاتصال فيما بينهاء وهكذا يمكن لباحثي مختلف الإدارات العملياتية في هيئة الطاقة الذرية الاستفادة 
من قدرة حسابية تعادل عملياً عشرة أضعاف من قدرة النموذج السابق الذي جُهز به المركز ذاته. 


يستطيع هذا الحاسوب العملاق الذي يصل ججم ذاكرته إلى 32 مليار بايت أن ينجز في الواقع حتى 
0 مليار عملية بالثانية الواحدة وبفضله وهو الأكبر استطاعة من أمثاله من هذا النوع المستخدم في 
فرنسا حتى هذا اليوم سيكون ممكناً ومن الآن فصاعداً المباشرة بعملية مجاكاة تتطلب حسابات ضخمة 
مع التأكيد على حصول تصحيح سريع للنتائج بتجنيد جميع المعالجات أو بعض منها لمعالجة قضية أو 
مسألة واحدة. 
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4-2-1 نمذجة الأنظمة متعددة المعالجات: 


[K Bag, 1997]‏ ,[HELR,1998]عتبر‏ نمنجة الأنظمة ذات دور هام في تحديد فعالية الأنظمة 
وتعقيدها وتعطي رؤية معمقة عن سلوكية الأنظمة. ويمكن أن نعتمد أسلوباً لفهم مشكلات التزامن 
والتوازي وهو المحاكاة التي تعتبر طريقة عامة تقريباً على كل الأدظمة إذ أن معظم سلوكيات الأنظمة 
تتشابه فيما بينها وبالرغم من أن المحاكاة اقتصادية أكثر من إنشاء الأئظمة مباشرة إلا أن هذا الأسلوب 
يعتبر بطيئاً وذو كلفة مرتفعة نسبياً إضافة لذلك فهي تعطي معلومات محدودة عن العلاقة المنطقية بين 
سلوكية النظام المحاكى وصفات النظام الحقيقي. 


1- نماذج الحساب المتوازي: 


يمكن أن نوضح مفهوم الحساب المتوازي بتعريف بعض النماذج سنقوم باستعمالها لتقديم أفكار ونتائج 
تشكل أساسات نظرية الحساب المتوازي. 


2- نظريات الحساب المتوازي: 


][M[Q»,1994[‏ وهي تعرآف أن المكان والزمان هما المصدران الأساسيان الأكثر أهمية المعرفان 
لتعقيد الحساب التسلسلي. وفي الحساب المتوازي تبقى أهمية الزمن نفسها: حيث أن السبب الرئيسي 
لدراسة الحساب المتوازي هو للحصول على زيادة سرعة حل المسائل الحسابية من 4ععمء » وبشكل 
بديهي يمكننا أن ندرك ببساطة أنه إذا توفر لدينا وحدات معالجة أكثر فإن الزمن المطلوب لحل مسألة 
معطاة ينخفض» وهذه الحقيقة تجعل وحدات المعالجة هي المتطلب الرئيسي الثاني في الحساب 
المتوازي. 
بالإشارة إلى النموذج الذي نعالجه فإن هناك العديد من مجموعات وحدات المعالجة لكمية متوفرة مسن 
المكونات الصلبة. وهذه المكونات الصلبة للحاسوب هي الوحدة الأكثر عمومية في القياس والتي يمكن 
في بعض الحالات أن تتطابق مع عدد وحدات المعالجة. 
الفكرة القائلة أن الزمن والمكونات الصلبة هما القياسان الرئيسيان للحساب المثوازي مستتدة على عدة 
نتائج مرتبطة بمصادر تسلسلية للمكان والزمان على التوالي مع الزمن والمكونات الصلبة في الحالسة 
المتوازية. 
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وهذا التطابق الموجود بين المكان والزمان في أي نموذج اعتيادي للحساب المتوازي يعطي نظرية 
الحساب المتوازي» وبالأخذ بعين الاعتبار أن جميع تماذج الحساب التسلسلي تتصل ببعضها بشكل 
متعدي يمكننا عندئذ أن نعبر عن فرضية الحساب المتوازي كما يلي: 


إن أي آلة حساب تورنك مع كلفة مكان (8)۸ يمكن أن تحاكى على نموذج عادي للحساب المتوازي 


بكلفة زمنية ((«)0)5-(,)1 » وبالعكس فإن أي حساب على نموذج عادي للحساب المتوازي مع 
كلفة زمنية ٠)١(‏ يمكن أن يُحاكى بواسطة آلة حساب تورنك بكلفة مكانية 8')۸(-0)۳)١(‏ حيسث 
هي ثوابت تابعة للنموذج. 


3“ الحسابات المتوازية والنماذج اللوغاريتمية: 
تعتمد معظم لغات البرمجة عالية المستوى على آلة خاصة صممت في بنية الحاسب المعتاد. تدعى هذه 
اللغات قاعدية ع۷تا»إءمص1 » ويعرف البرنامج على أنه أوامر تسلسلية أساسية للمعالج» كما أن بنية 


الحاسب المعتاد نفسها تعتمد على النظرة التسلسلية للحسابات. ومن وجهة منطقية يمكن أن نعتير بعض 
خطوط البرنامج مستقلة حثى إذا كانت تسلسلية فيزيائياً. 


لنأخذ برنامج ضرب مصفوفتين من الحجم 1 وهو برنامج خطي مستقيم يعبر عن الحالة 2<" وهو 
For i=l until n do‏ 
For j=l until n do‏ 
Begin‏ 
c(ij}*0;‏ 
For k=l until n do‏ 
c(ij) = c(i,j) + afi,k) * b(kıj)‏ 
end;‏ 
سنبين الآن الخطوات التي يتم فيها تنفيذ البرنامج وكيف تأخذ عناصر المصفوفة الناتجة قيمها وذلك 
فيما يلي : 


1 cell) =0; 
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2 c(1, —~c(1,1)+ a(1,1) * b(1,1); 

3 c(1, ~^ c(1,1)+ a(1,2) * b2,D; 

4 c(1,2)—~0; 

5 e(1,2) ^~ c(1,2) + a(1,1) * b(1,2); 

6 c(1,2) ~*~ c(1,2) + a(1,2) * b(2,2); 

7  e2,1)¬0; 

8 c(2,1) ¬ c(2,1) + a(2,1) * b(1,1); 

9 c(2,1) ¬ c(2,1) + a(2,2) * b(1,2); 

10 c(2,2) +0; 

il c(2,2) ¬ c(2,2) + a(2,1) * b(1,2); 

12 e)2,2( + c)2,2( + a)2,2( * 2,2(7; 

من الواضح في تحقق البرنامج أن بعض التعليمات يتعلق بالآخر ولذلك نشكل السلسلة من التعليسسات 
الأكثر لزوما. 

نلاحظ أن البرنامج يمكن أن يقسم إلى أربع مقاطع مختلفة كل واحد منها يحسب 1 عنصر من 


ومن الواضح أنه يمكننا حساب العنصر (2,2)ء أولا ومن ثم نحسب العنصر (1,1)ء. كما نجد أن 
هناك اختلافاً بين حالتين وهما حساب العناصر ٠)1,1(‏ و (2,2) وبالمشسل (1,2)ء و(2,1)ء حيسث 
يمكن حسابهما على التوازي وذلك على افتراض توفر المصادر الحسابية المناسبة. لذأخذ الآن الشكل 
الثالي الذي يرمز إلى أن التعليمة 1 تسبق التعليمة ز: 


23 


All Riehts Reserved - Library of University of Jordan - Center of Thesis Deposit 


ولكي نرمز إلى أن التعليمات [,...,1 تسبق التعليمة 1 وبالعكس التعليمات بل...,ز مسبوقة بالتعليمة 


زنكتب على الثوالي: 


يمكننا أن نصيغ بهذه الرموز بشكل بياني الترتيب الذي يمكن أن تنفذ فيه تعليمات البرنامج ويدعى هذا 
الترميز ببيان الترتيب الجزئي hطضزgra .partial ordering‏ 
يبين الشكل التالي بيان الترتيب الجزئي لبرنامج ضرب مصفوفتين الذي أوردناه سابقاً: 


الشكل (6-1) بيان الترتيب الجزئي لبرتامج ضرب مصفوفتين 
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ر 


شکل (7-1) بيان ترتيب جزئي 


تكون التعليمتان مستقلتان إذا كانتا غير متصلتين بمسلك (طريق) على الغراف (البيان) وعندئذ يمكن 
تنفيذهما على التوازي. 


من الواضح أنه عندما يسري برنامج على التوازي فإن النتائج يجب أن تتدفق متزامنة › وهذا 
ضروري لكي نتأكد من أن الحسابات صحيحة. 


لنفترض كمثال بيان الترتيب الجزئي في الشكل(7-1) وانفترض أن كل تعليمة تحتاج نفس الزمن فإن 
المسلك (4,6) (3,4) (2,3) (1,2) سيكون أطول من المسلك (5,6) (1,5). 
إذا كانت التعليمات على طول المسلكين تنفذان على التوازي فإنه يجب أن نزود البرنامج بتفنية تزامن 
ما بين تدفقي البرنامجين ليضمن أن التعليمة 6 لم تنفذ قبل التعليمتان 4 و5 . 


يمكن أن نجعل جميع المسالك بطول متساوي باستخدام حل وحيد وهو إضافة تعليمات خالية مثلاً 
التعليمة : × -ه × حيث × هو أي متغير » ونرمز للتعليمة الخالية في بيان الترتيب الجزئي بتعليمة 


2 
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إن بيان الترتيب الجزئي لتعليمات برنامج يعرف حساباً متوازياً ممكنأًء ومن الواضح أن قدرة ثتفيذ 
التعليمات المستقلة يعتمد على توفر المصادر الحسابية. علاوة على ذلك يجب أن نعرف معياراً يحدد 
التعليمات للمعالجات» وبالاعتماد على نموذج الحساب المتوازي تحدد التعليمات تبعاً لأحد البندين 
التاليين: 


1- كل عقدة بيان (مثلاً كل تعليمة) محددة لمعالج مختلف. وفي هذه الحالة فإن الأقواس الداخلة 
(الخارجة) من العقدة يمكن أن تظهر كاتصالات من (إلى) ذلك المعالج الذي يتلقى (ينقل) 
البيانات. 

2“ تحدد المسالك المختلفة (ليس بالضرورة مسالك مستقلة) لمعالجات مختلفة › في هذه الحالة تنفذ 
التعليمات على نفس المسلك من قبل نفس المعالج وينشئ المعالج حساباً تسلسلياً. تحدث 
الاتصالات فيما بين المعالجات في تلك العقد حيث تعرآف المسالك المختلفة العلاقات فيما بينها 
كما في الشكل(8-1): 


معالج3 معالح2 معالج1 


شكل (8-1) تحديد التعليمات للمعالجات 
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في الحقيقة نحن نبحث عن طريقة نظامية للحصول على بيان من بيان الترتيب الجزئسي للتعليمات 
لبرنامج معطى» حيث يتم في هذا البيان زيادة الاحثمال المتوازي إلى الحد الأعلى من الحساب 
التسلسلي. ومن جهة أخرى نلاحظ أنه ليس بالإمكان الحصول دائماً على خوارزميات متوازية فعالة 
من الخوارزميات التسلسلية الفعالة. إن مسألة موازاة الخوارزميات التسلسلية هي مسألة مهمة عندما 
ندرس المترجمات (المصنفات „(vector machines) ةıعlaÈll JÎ1 gİ (compilers‏ 


إن معظم لغات البرمجة تتماثل من وجهة النظر الأساسية للحسابات ويمكن أن تظهر تعليمة الحاسسب 
التقليدي كأمر للمعالج وكدالة » متغيرات هذه الدالة هي موقع الذاكرة (أو القسيم المخزنة في تلك 
المواقع). إذا كان لدينا تعليمة ز1 ستعمل قيم مواقع الذاكرة رk‏ وتحسب محتويات مواقع السذاكرة زط 


j :M ¬ NM" 
مع المسجلات ونكتب:‎ ۸۸M حيث 1 مجموعة من مواقع الذاكرة نتطابق في النموذج‎ 
Load : M ¬+ M ) 
Add : M ¬ M 
ومن المعروف أن التعليمات المستقلة يمكن أن تنفذ على التوازي ولدينا:‎ 


لتكن ([) المحتواة في M1‏ ترمز إلى مجموعة مواقع الذاكرة التي تستعمل قيمها في بعض التعليمات 
1. 


ولتكن (8)1 المحتواة في 1 ترمز إلى مجموعة مواقع الذاكرة التي عدت محتوياتها من قبل التعليمة 
1 

إذا كانت 1 من النوع 1 فإن عدد العناصر في المجموعة (5)1 و (۸)1 هو ر و زط على الثوالي. 

4- شروط برنشتاین: 

لكي تكون التعليمتان 1 و J‏ مستقلتين فإنه من الكافي أن تتحقق العلاقات التالية والتي تدعى شروط 


یرنشتاین: 


R(D N RO) =% 
DONRO) =% 
RD ND) =© 
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عندما لا تتحقق شروط برنشتاین عندئذ يوجد تبعية منطقية بين 1 و [ وللحصول على حساب أكيد 
يجب أن ينجز التسلسل. 


سنحدد الأن طريقة للحصول على بيان الترتيب الجزئي الذي بزيد الحد الأعلى لاحتمسال التكوازي 
الحساب التسلسلي: نعمل على تطبيق شروط برنشتاين على كل زوج من التطيمات فإذا لم يكن أي 
منها غير محقق عندئذ يکون البيان يصف الحساب المتوازي بشكل أعظمي. كمثال نأخذ برتامج ضرب 
مصفوفثين من الحجم ١‏ المذكور سابقا ونلاحظ أن استخدام برنامج مختلف يمكننا من الحصول علسى 
حساب موصوف بزمن متوازي متتاسب مع 1٥2 ١‏ أكثر من أن يتناسب مع 1. وكما رأينا أن كل عقدة 
في البيان تشير إلى معالج مختلف وكل قوس يدل على بيانات متبادلة على طول بعض الاتصالات 


إن عدد العقد يعطي مقياسا لمصادر المكونات الصلبة المطلوبة من قبل الحساب طالما أن طول المسلك 
الأطول يقيس زمن التوازي (عص1) 1عاله٣هم).‏ 


5- تعريف النموذج اللوغاريتمي: 


أ ّ 3 »+ * مڪ ڪل . ۳ | . . 
يبدا هذا النموذج من شروط برنشتاين لاحتمال توازي الخوارزميات (ولا يهتم بالتفاصسيل) ويمكن 
وصفه بالحقائق الثالية: 


1“ يمكن أن يستعمل أي عدد من المعالجات في أي لحظة. 

2“ يمكن أن ينفذ كل معالج أي تعليمة (رياضية أو منطقية) في وحدة زمن. 
3“ لا يوجد كلفة من أجل الوصول للبيانات. 

4“ لا يوجد كلفة للاتصال بين المعالجات. 


أما المصادر الأساسية المطلوبة من النموذج فهي عدد الخطوات المتوازية (عدد وحدات الزمن) وعدد 
المعالجات المستعملة كدالة في حجم المسألة. 


مثال(3-1): 


يمكن أن نتحقق من قواعد تعريف النموذج اللوغاريتمي ونطبقها على خوارزمية حساب ناتج جداء 
مصفوفتين وتحليل الكلفة الناتجة: 


الدخل: مصفوفتين (ھ) = 4 و (رط) = 8 من الحجم ۸. 
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الخرج: مصفوفة (زء) = ٣‏ من الحجم ۸ حیٹ: .]K=۸8‏ 
الخطوات: 


1. حساب ال ص ناتج على التوازي حیث: زط * a‏ = زرا 
2. حساب ال ۸ مجموع على التوازي حیث: زا + .., + زرا + رانا = و ؛ ہر..۔,1=زیا 


نستعمل المخطط التالي للتوضيح ونرمز فيه ب 1 بدلا من زرا وفيه 8=" وهو في الشكل(9-1). 


tila 


الشكل(9-1) حساب مجموع 8 أعداد 


ه الكلفة: 

الخطوة 1 تتطلب وحدة زمن واحدة و م معالج. 

الخطوة 2 نتطلب 1 10g n‏ ] خطوة و n‏ معالج مطلوب. 
عندما يكون العدد م من المعالجات ثابتاً يكون التوازي منتهياً. 


يمكن تحليل إنجاز الخوارزمية عن طريق مقياسين آخرين وهما: زيادة السرعة والفعالية. 
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* زيادة السرعة من لععمء ونرمز لها (م)م8 تعرف بأنها النسبة بين كلفة الزمن لأفضل خوارزمية 
تسلسلية متوفرة وكلفة الزمن لخوارزمية التوازي التي نحللها. عندما تكون خوارزمية التوازي 
تملك على الأغلب م معالج متوفر فإن:(۸)م / (۸)ر1 = (0)م8 حيث ۸ هو حجم المسألة. 

نلاحظ أن أفضل حالة لهذا الشرط هو عندما يكون م = (م)م8 وذلك من الصعب الوصول إليسه 
عمليا. والمطلوب هو الحصول على مسألة تحل بزمن تسلسلي («)1 أن تحل بزمن متوازي 
۴8 حيث م هو عدد المعالجات المتوفرة. إضافة إلى آنه يوجد زمن ما لا محالة في الحساب 
المتوازي يستعمل لتنسيق فعالية المعالج. ويتحدد التوازي تبعا لطبيعة المسألة نفسها. 

الفعالية (رإعمعاء]٤؟ء)‏ ونرمز لها (”)م۴ وهي النسبة بين زيادة السرعة وعدد المعالجات: 


)م = (”)ر۴ من الواضح أن 1ک(ه۴)۸ وتتحقق أفضل فعالية عندما تطبق إشارة التساوي. 
يطبق مفهوم زيادة السرعة والفعالية عند دراسة التوازي وفي تحليل الخوارزميات عندما يزداد عدد 
المعالجات مع حجم المسألةء في هذه الحالة نجعل («)م-م وتحسب زيادة السرعة والفعالية كما لو أن 
م ثابت. 
في هذا النموذج نحاول الحصول على المعلومات التالية: 

1- القيم من الحجم ١‏ التي من أجلها يكون إنجاز الخوارزمية أفضل. 

2- السلوك المقارب لزيادة السرعة والفعالية. 
في المثال السابق تعطى زيادة السرعة والفعالية كما يلي: 

S(n)=n°/({logn| +1)‏ 
Ef (n) =1 /(llogn| +1)‏ 
نلاحظ أن الفعالية تتلاشى عند النهاية » + د هذا يعني أن ” هي الأعظمية الزمن الأطول الذي تكون 


وهكذا نجد أن الاقتراحات السابقة هي احتمالات لدراسة الخوارزميات المتوازية. أحدها لاتفكير في 
العدد م لوحدات المعالجة المتوفرة كثابت ولمحاولة ثأليف خوارزميات متوازية مع زمن تثفيذ (۸١)م1‏ 
يرفع زيادة السرعة إلى الحد الأعلى. من جهة أخرى م يمكن أن يكون كدالة في حجم الإدخال أي أن 
(7)م = م ویمکن تجریب خوارزمیات تحتاج أقل احتمال لزمن متواز. 
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6- الدارات المنطقية: 


[4[,1992[[] قبل أن تبدأً الدراسات حول التوازي كانت تستعمل الدارات المنطقية بشكل كبير عندما 
ندرس تعقيد الحسابات ونستعمل طول الدالات المنطقية (البوليانية). من ناحية ثائية فإننا نرى أن 
الحواسيب الاعتيادية هي آلات متوازية عندما ندقق أكثر بالتفاصيل ففي الحقيقة إن كل حاسب مصنوع 
من دارات الكترونية تحوي الملايين من العناصر المفتاحية وخطوط النقل كلها تعمل على التوازي › 
والدارات المنطقية هي نموذج منطقي من الدارات الالكترونية. يعمل هذا النموذج على مسائل تمثل 
بسلسلة من الخائات ولهذا السبب فإن الدارات المتطقية تميز نفسها بأنها معالجات خطية ( اء 
56عئع*<م)). تحول جميع المعلومات الداخلة والخارجة من حاسب حقيقي إلى رموز في سلسلة من 
الخانات الثنائيةء ومع بعض الثرتيب في البئية تصبح دالة على بيانات » بمعنى أن السلسلة تعتمد على 
التفسير (الترجمة) «0ااداءإ م٣٤"‏ وهو خارجي بالنسبة للآلة. وبما أن تتفيذ العمليات يتم في مستوى 
الخانة فإنه عندما نعبر عن خوارزمية بدارة منطقية فإن كلفتها تدعى [ كلفة الخانة أومء 11ط] بينما 
يدعى تعقيدها [ تعقيد الخانة ران×ءامه» ط] وهي تعد مقياساً لكلفة التوازي. إن الخصائص السابقة 
تجعل نموذج الدارة المنطقية قاعدة لدراسة تعقيد الحسابات المتوازية. 


7- تعاریف: 
مړه e1 ۹ e‏ 


لتكن لدينا دارة منطقية » ولها 1 دخلا و "۳ خرجا هي بيان حلقي ومعنون وموجه »=)۷,٤(‏ 


input nodes Jخدلl عقد‎ ¬1 
constant nodes Aتبlڈژ عقد‎ -2 
operation nodes lale عد‎ ~3 
output nodes عقد لخر ج‎ ¬4 


-ال 1 عقدة دخل لا تملك أقواساً داخلة إليها. كل واحدة منها معئونة برمز متغير مختلف. فيما را 
قو إ1 برمز متغیر 
سنفترض أن هذه العقد مرقمة من 1 إلى ۸ وأن عنون العقدة ¡ هو ز× حيث: (طر..,1<). 


-العقد الثابتة لا تملك أقواساً داخلة إليها وكل منها معنون ب 0 أو 1. ويمكن أن تكون مجموعة العقد 
الثابتة خالية (فارغة)ء وإن وجدت هذه العفد فإنها ثرقم من 1٣ہ‏ إلى ٤٣ہ‏ حیٹ 1 < .C‏ 
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حال ” عقدة خرج لا تملك أقواساً خارجة منها وتملك تحديداً قوس دخل واحد. كل منهسا معنون 
بواسطة رمز متغير مختلف. ستفترضصض ل هذه العقد مرقمة من 1 + ]V|— m‏ إلى |۷ |وأن عنوان 
قدة اهو زل حيث: | ۷ | |-+٣1,...,‏ ۷ | =ا. 


عقد العمليات تملك الأقواس الداخلة والخارجة. كل منهأ معتون بزمز لدالة منطقية مع واحد أو أكشر 
من الوسطاءء ويعطى عدد الوسطاء الموجودة بواسطة عدد الأقواس الداخلة إلى العقدة. ستفترض فيما 
يلي أن عنوان العقدة ذ مع :ز قوس دخل هو ري حيث: 

fo: {O0,}F ~* {0,1} ,i=nte+1 ,..., | V|-m 


المجموعة [٣ا,...,1٤)=۴‏ من جميع الدالات التي تعنون عقد العمليات في » تدعى قاعدة الدارة. وفي 
حالة خاصة يمكن أن تكون مجموعة عقد العمليات فارغة. 


عدد الأو اس الداخلة [الخارجة) لعقدة معطاة يدعى ١1-صة؟‏ (ااه-م؟) لتلك العقدة . ويعثبر أعظضم 

fan-n‏ (imum>مص)‏ لجميع العقد هو «ز-صه؟ للدارةء ويحدد عن طريق الدوال القاعدية. 

سنبين ذلك على قاعدة تدعى القاعدة القانونية وهي مكوئة من عمليات الجمع المنطةسي والضرب 

المنطقي والإتمام المنطقي والتي نرمز لها بالرموز الثالية على التوالي: 

(۷ و ٣و‏ د). 

من المعروف أن القاعدة القانونية هي قاعدة تامة › على سبيل المثال إن أي دالة منطقية يمكن أن نعبر 

عنها بواسطة عمليات الجمع المنطقي والضرب المنطقي والإتمام المنطقي فقط. ال 1١‏ مه للدارات 

المعرفة على القاعدة القانونية هو بوضوح (2). 
تعريف 2: 


لتکن »=)۷,E(‏ دارة منطقية ب 1 دخلا و ۳ خرجاً » یرمز لحجم الدارة » ب (ه)Z‏ وهو عدد 
العقد في الدارة أي إن: | ۷ |= (»)2 . إن ص + ,< .Z)»(‏ 


يرمز ب (»)0 لعمق الدارة » وهو الطول الأعظمي للمسالك في الدارة (أي بين جميع المسسالك 
الواصلة بين عقد الدخل وعقد الخرج).إن الحجم والعمق هما أهم مقياسين للتعقيد في الدارات المنطقية. 


يظهر الشكل (10-1) دارة منطقية بسيطة فيها أربعة مداخل ومخرج واحد. حجمها وعمقها على 
التو الي هما 15و 6ء 
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شكل (10-1) يبين دارة منطقية بسيطة تعتمد على القاعدة القانونية فيها 2)0(=15 و 5)»(=6 


سنفترض فيما يلي أن كل عقدة دخل نتصل بعقدة خرج من خلال مسلك » إذ إن كل دخل يستعمل في 
تحديد قيمة الخرج إلى حد ما مما يوضح أهمية العمق لدارة. إن الدارة » ب ١‏ دخلا و ص خرجاً 
حیثٹ حم تملك عمقاً لا يقل عن ۳1 (اہ),عه1/ً حيث † هو نمه الدارة. 


ويمكن أن يكون حساب الدالة لكل دارة ومن أجل ذلك سنضع بعض الملاحظات التمهيدية. لتكن الدارة 
» ب 1 دخلا و " خرجا ولتكن ۸ ترمز إلى عنوان دالة في عقد » وهي: 


A: {ly..Z(C)} ™ {Xi,..Ka} U {Ym O {0,1} U {fiss} 
يعرف الدخل للدارة » ب 1 دخلا بتحديد قيم المجموعة [0,1) إلى المتغيرات المعنونة لعقد الدخل.‎ 
:)0,1[ وبشكل تظامي فإن الدخل ۲ هو دالة معرفة على إ[مر...,×) بالقيم‎ 
Y : {X1g.-eXn} {0,1} 


لنفترض أيضاً أن العناوين 0 و 1 ترمز إلى القيم 0 و 1 على التوالي. 
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القيم (1 ,))تحسب بواسطة العقد ) على الدخل ١‏ وتعرف كما يلي: 


(^ (k)) if 1sksn 


0(resp.1) if nti sksntc 
and A(k) = 0 (resp.1) 


Vk Y=  iag (VCijrs Ys -«, Vik: ¥) if ntct1 sk sS Z(a)-m; 
) حیٹ: را عنو ان العقدة‎ 

ويوجد في الغراف كل من 

(iı kK), و‎ (ijk ,k( الأقو اس‎ 


Vü,.7 if k> Z(a)-m 
)زرK( ویوجد القوس‎ 
أي آنها تحسب القيم كما يلي:‎ 
عن طريق عقدة الدخل: تدل القيمة على العنوان الخاص بالدخل ل‎ ~1 
عن طريق العقدة الثابتة: هي القيمة التي ثرمز للعنوان.‎ -2 
عن طريق عقدة العمليات: توجد بتطبيق دالة العنوان على القيم المحسوبة بواسطة الأسلاف‎ 3 
الوسطى تبعاً للترتيب الثابت.‎ 
عن طريق عقدة الخرج: هي القيمة المعطاة بواسطة الأسلاف الوسطى فقط.‎ “4 
:5 بف‎ 1 


القيمة المحسوبة بوساطة دارة » ب ” خرجاً للدخل ١‏ هي السلسلة "[0,1)> (لر») ل تحسب على 
الطريقة النظامية بوساطة عقد الخرج (»)2)... Z)»(-٠+1‏ أي أن: 


Y(a,y) = V(Z(o)-m+1, ¥) ...V(Z(e),) 


e 


تعریف 4 


تقوم الدارة » بس دخلا و ا خر انناب الدالة }0,1{ ج }0,1{ f:‏ » من أجل أي دخل ‏ 
فإن : Y(a,y)= Ê1 , X2 , ..., Xa)‏ 
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نلاحظ أن الدارة تحسب دالة واحدة وواحدة فقط أي لها سلوك حتمي 1اءأمذ.۲عاعل. 
* تعريف 5: (إضافة خانة واحدة (one bit adder‏ 


يبين الشكل (11-1) دارة تحسب الدالة: 
f(x, X2, X3) < Y1, Y2>‏ 
حیٹ: 2 Y1 = fx , X2, X3) = (xı + x2 + xڊ) div‏ 
Ya = f(1 , X2, X3) = (xı + x2 + x3) mod 2‏ 


الشكل (11-1) إضافة خانة واحدة 


تتألف الدارة من دارتين جزئيتين تحسبان 0۸ المخصصة لخانتين ولجعل المخطط مقروء بشكل 
أوضح سنستعمل الاتفاقات التالية: 

- سنضع الأضلاع عوضا عن الأقواس ونحدد الاتجاه من القمة إلى القاعدة. 

- يخرج من العقدة ضلع واحد فقط بينما نستعمل نقاط اتصال محتملة ليتفرع الضلع 


للوصول إلى العقد الخلف. 


نلاحظ أن أاه-صهf‏ لجميع عقد الدخل في الشكل السابق هو اثنان ولا واحد. 
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زا كان لدنا مثلاً مسالة ۸ لها الحجم 2 [رنرمز لذلك عادة ٻالرمز ۾۸) مرصرفاً ب (ه)ع خانة رإذا 
كانت حلول الأمنلة ل ۸ موصوفة ب (١«)ط‏ خانة فإن الدارة المنطقية التي تحل م8 يجب أن تملك 
()ع مدخلا و ()1 مخرجا۔ 


٭ تعريف 6: 


ا 
لتكن “"[0,1 × *[0,1] ج مء تعتبر الدارة » ذات ال (۸)ع مدخلا وال (۸)ط1 مخرجاً حلاً 
للمسألة المعرفة ب 8 إذا كانت تحسب الدالة : 
f, : {0,1} ¬ 0,1‏ 

وإذا حققت : أنه إذا رمزت × لفرضية ما ل 8R‏ وكانت × تملك على الأقل حلا وحيدا فإننا نحصسل 
على )x, fı)×( (€ R‏ . 

يمكن أن تستعمل الدارات بمخرج واحد لتمييز اللغة على الأبجدية [0,1) = 2 » ويشكل دقيق أكشر 
إا كانت ۸ لغة ما معرفة على < (أي أن *< ے ۸ ) » ولتكن ”۸ ترمز للغة "< ٣‏ ۸ وتتألف 


من السلاسل في ۸ بطول 1 تماما » عندئذ ستستعمل الدارة ذات ال ١‏ إدخال ××× والخرج 
الوحيد ر لتمييز اللغة "۸ إذا كانت 1ر وإذا كانت "64 و .ر2× 


مثال(4-1): 


الدارة المنطقية التي تظهر في الشكل (10-1) تميز سلاسل *0*1 ۸ “[0,1) > س أي إن: السلاسل 
في ي 
بطول 4 حيث جميعها أصفار إذا كان أي منها يسبق ب 1. 


على سبيل المثال: السلسلة "0011" يمكن آن تميزها الدارة (وتكون قيمة الخرج 1=رل) بينما السلسلة 
"01" ستستبعدها الدارة ([أي أن 0 رر). 


لا يمكن اعتبار الدارة المفردة نموذجاً حسابياً مناسباً والسبب أن بنيتها الثابتة ثمنع حل المسائل من أي 
حجم ولذلك نحن بحاجة أن نأخذ مجموعة من الدارات أفضل من دارة مفردة لكل حجم مفروض. ومن 


أجل ذلك لنأخذ التعريف التالي: 
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تعربف 7: 


تكون بم [م0) مجموعة دارات تحل المسألة ۸ إذا وفقط إذا كان من أجل أي ۸6۸ فإن مه تحل ۾ 


یمکن ن نوسع مفهومي الحجم ماك والعمق طامعل على مجموعاأت الدارات. 
حجم (عمق) مجموعة بم إم0] هو دالة : 

Za:N*N (Du: NN) 
ے0) › ونکتب (72)۸ و (۸) ببساطة دون ذکر ے.‎ )١( بحيث: وه لها الحجم (0) ى7 (العمق‎ 
: مثال(5-1) -إضافة (11ط-م) 1 خانة-‎ 
مکر.۔۔ور۔و× = × و ولڑہ.۔۔ ,رول =۷ عن طریق‎ ٥-1٤ یمکن أن نحسب مجمو ع عددین صحیحین ب‎ 
الدارة الموضحة في الشكل (12-1) حيث كل مقطع مسمى 08۴۸ (موجود من أجل إضافة وإملاء‎ 


one bt‏ خانة واحدة )"One-Bit Ful! Adder"‏ هر جزء عملي هم "ممه (آي آنه يحوي 
العملياث فقط) لإضافة خانة واحدة 1ا-0۸6. 


لاحظ أنه : تعنون في هذه الحالة عقد الدخل ب × و ل بينما تعنون عقد الخرج ب :5 (حيسث 
)i=0,...-1‏ و ۰C‏ 

الأقواس الداخلة ل ;ء حيث (حيث )1=0,...,١-1‏ تأتي من المحدد الثاني 0۸ للمقطع 08۴۸ 
(بمعنى آخر أنها الدخل للعقد المعنونة ۷) بينما القوس الموجود في أقصى اليمين الذي يدخل إلى كل 
نموذج 08۴۸ ما عدا الأول منها يأتي من عقد 0۸ لل 08۴۸ السابقة (أي الدخل للعقدة المعنونة 
.(Y‏ 


بما أن ١‏ عشوائية فإن الدارة في الشكل (12-1) تدل على مجموعة بالحجم والعمق 161+2 و 20+5 
على التوالي. 
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الشكل (12-1) يمثل إضافة "١‏ خانة 


8- ملاحظات: 


سننهي هذا المقطع بملاحظات على مدلولات الحجم والعمق كمقياسين لتعقيد السدارات. مسن الناحية 
العملية نجد أن حساب الدارة المنطقية للدالة ۴ تصف الحسابات بشكل نظامي مختصر وهذه الحسابات 
هي التي ننفذها الخوارزمية التي تحسب الدالة ۴ على حاسب حقيقي. وهذا ممكن على أية آلة حساب 
حقيقية على الأقل من أجل تحديد العناصر الحسابية الفعالة وترتيبها وفقاً للفعالية. ومع هذه المعلومات 
أصبح من الممكن بناء بيان امهإع يصف الحسابات بالطريقة التالية: 


1- ندل على كل عتصر حسابي بواسطة عقدة. 
2- إذا كان العنصر × عند الحساب يعطي عنصر بيانات خرج إلى العنصر ل عندئذ يضساف 
القوس (ل,×) إلى البيان. 


وباختصار إن الدارة المنطقية (البوليانية) أساساً هي اختصار لبيان حسابي مبني وفقاً لما ذكر. ومسن 
هنا نرى أن عقد العمليات هي عناصر حسابية بينما الأقواس هي وصلات لنقل البيانات من وإلسى 
الوسط الخارجي على التوالي. 


بناء على وجهة النظر العملية هذه يتضح أن حجم الدارة هو تقدير مناسب لكلفة المكونات الصلبة 
لجساباكه: 


في الحقيقة إن حجم الدارة المنطقية بتعلق بشكل وثيق بعدد العناصر الحسابية في البيان الممائل. ومن 
جهة أخرى يمكننا أن ندرك أن الحجم عموما هو تخمين سْيء للكلفة. وهذا يعود لحقيقسة أن الدارة 
المنطقية حلقية مما يجعل من المستحيل استعمالها للعقدة نفسها أكثر من مرة. 
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مقياس المكونات الصلبة البديل هو عرض الدارة (طال!س اااء1ء) نفترض لتعريفه أن جميع العقد في 
الدارة يمكن أن تقسم إلى مستويات وفقا لما بلي: 


1- عقد الدخل والعقد الثابتة هي المستوى 0 بالتعريف (0 1عvء]1).‏ 
2- كل العقد الأخرى هي للمستوى 1 إذا وفقط إذا كان سلفها الوسطي في المستوى 0 أو فسي 
المستوى 1-1 (تدعى الدارات التي تحدد هذا الشرط ب .(synchronous‏ 


عندئذ يمكننا أن نعرف عرض الدارة بأنه العدد الأعظمي للعقد (إuدصا×ةه)‏ في كل مستوى. 

يقيس العرض الأعظمي العناصر الحسابية العاملة بالتوازي في الحساب. 

عمق الدارة إام#ل يُحسب بواسطة دالة £ هي من جهة أخرى قياس للزمن الكافي لحساب ؟. 

يعتبر العمق مقياساً جيداً للزمن المتوازي. ولمعرفة ذلك يمكن أن نفكر بالتشابه مع الحاسوب الحقيقي. 
نصف الدارة التي تنجز الحساب جيدا بوساطة زمن المعالجة المتناسب مع العدد الأعظمي للعناصر 
بغض النظر عن الإشارة حيث أننا نحد من المعالجة لعناصر الحساب المخئلفة عن الصفر. وهذأ يعني 
عمق الدأرة نفسه. 

نلاحظ أن الزمن هو حقاً زمن متواز حيث إن تأثير العقد على المسالك يريط المداخل بالخرج وذلسك 
يحدث على التوازي. 


39 


All Rishts Reserved - Library of University of Jordan - Center of Thesis Deposit 


الفصل الثاني 


دراسة الخوارزميات المتوازية 
وأنواعها وتمييز خواصها وتقنيات 
تصميمها ومقاييس تحليلها وتحديد 
ن 
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1-2 مقدمة عن الخوارزميات المتوازية: 


منذ بداية عصر معالجة المعلومات أدرك العالم أن من المفيد جعل الأجزاء المختلفة للحاسوب تقوم 
بأشياء مختلغة في الوقت نفسه. فبينما تقوم وحدة المعالجة المركزية بالحساب يمكن أن تقرأً المدخلات 


وفي أجهزة متقدمة أكثر تحوي معالجات بسيطة متعددة يختص كل مذها بعمل معين ونشترك فيما بينها 
لإتجاز المهام المقدمة للمعالجة. 


وبالرغم من أن سرعة المعالجات قد ازدادت بشكل كبير إلا أن الطلب على معالجة أسرع للمعطيات 
أصبح ضروري أكثر كما أنه من غير الممكن في أغلب حالات تطبيقات الزمن الحقيقي إنجاز كل 
الحسابات باستخدام معالج واحد. وقد قاد ظهور الأجهزة المتوازية ذات المعالجات المتعددة المتزامنة 
وغير المتزامنة وظهور الشبكات الكبيرة إلى إعادة التفكير في مفهوم الخوارزميات إذ أن الخوارزمية 
تهدف بعد أن تتحقق من وجود الحل إلى البحث عن حل عملي. 


كما أن الحاسوب المتوازي الذي يحوي العديد من وحدات المعالجة يقوم بتجزئة المسألة المعطاة إلى 
مسائل جزئية يقوم بحلها بشكل متزامن كل مسألة جزئية في معالج مختلف وبعد ذلك تجمع النتسائج 
لإعطاء حل المسألة الأصلية. ويعتبر هذا انتقالاً جذرياً من نموذج الحساب بالحاسوب المعتمد في بتاء 
الحاسبات أي ذات المعالجات التسلسلية. وقد أصبح التوازي يضاهي تحقيق سرعات عالية جدأ للحساب 
بوساطة الحاسوب. ومع ظهور الحواسيب المتوازية وتوفر مكوناتها المادية نجد أن هناك سوالا 
مطروحاً وهو: كيف نبرمج الحواسيب المتوازية لحل المسائل بشكل فعال وعملي وبطريقة ذات كلفة 
منخفضة. بالطبع نحن بحاجة في الحساب المتوازي إلى خوارزميات ولغات برمجة ومترجمات .. 

الخ» بالإضافة إلى أن الأنظمة العملية بحاجة فعلاً لإنجاز الحساب على المكونات المادية المتوازية. 


2-2 تعريف الخوارزمية المتوازية: 


تعرف الخوارزمية المتوازية بأنها مجموعة من العمليات التي تنجز كل منها خوارزمية تتابعية خاصة 
بها وتتبادل الاتصالات فيما بينها عبر شبكة اتصالات محددة. 


ويمكن أن نميز بين حالتين في الخوارزميات المتوازية وذلك حسب طريقة اتصال المعالجات فيما بينها 
إذ أنه في حين اتصال المعالجات عن طريق شبكة اتصالات محددة فإن طبولوجيا هذه الشبكة يعبر 


41 


All Rishts Reserved - Library of University of Jordan - Center of Thesis Deposit 


هاما ومؤثرا في زمن نتفيذ هذه الخوارزمية وفي فعالية الخوارزمية وذلك تبعا لوجود خط اتصال بين 
المعالجين الموافقين. وعند اتصال المعالجات بوساطة الذاكرة المشتركة القابلة للتقسيم يستطيع كل 
المعالجات. 


وبما أن الخوارزمية المتوازية هي طريقة حل للمسائل على الحواسيب المتوازية. لذلك فهي تتبع بشكل 
أساسي اللنماذج الرياضية الأساسية في الحاسوب المتوازي والتي قمنا بتعريفها في الفصل الأول 
وتتمايز أنواعها حسب أنواع الحواسيب المتوازية. 


3-2 تحليل الخوارزميات المتوازية: 


لقد ازدادت سرعة الحواسيب كيرا في الأربعين سنة السابقة فقد كان يُعتقد أن فعاليسة الخوارزميات 
ليست ذات أهمية كبيرة ولكن الحقيقة التي ظهرت اليوم أن الفعالية أمر مهم أكثر مما سبق. 


وهذا ما يدعونا إلى التعمق بتحليل الخوارزميات المتوازية لمعرفة فعاليتهاء[1997-)۲3ء[] وأهسم 
أسباب فعاليتها هو أن الزمن الذي تأخذه معظم الخوارزميات للتنفيذ هو دالة غير خطية في حجم 
إدخالها وهذا يمكنه أن ينتج بشكل أكبر قدرتها على الإفادة في زيادة السرعة. كما أن الحواسيب 
السريعة تحتاج إلى خوارزميات أكبر للاستفادة من طاقتها. 


يحدد تحليل الخوارزميات المتوازية درجة جودة الخوارزمية وهذا يعني سرعتها وكلفة تتفيذها ومدى 
فعاليتها عند استعمالها في الوسائل المتاحة. ولذلك فإننا نهتم بالمعايير التاليسة: زمن التنفيذ وعدد 
المعالجات المستخدمة ومن ثم نقوم بحسساب الكلفة. [SeGA-1989] , [An Je,1974],‏ 
[GSAG,1994]‏ 

Running time iيفنتل| أولا: زمن‎ 1-3-2 

بما أن سرعة الحسابات هي السبب الرئيسي الذي جعلنا نهتم ببناء الحواسيب المتوازية لذلك فإن 
المقياس الأهم في تقييم الخوارزمية المتوازية هو زمن تتفيذها. 

ويمكن تعريفه بأنه الزمن الذي تأخذه الخوارزمية خلال حل المسألة على حاسب متوازي. وذلك يعني 
أنه الزمن المستهلك من الخوارزمية منذ اللحظة التي تبدأً فيها إلى اللحظة التي تتتهي فيها. 
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إذا كانت المعالجات المتعددة لا تبدأً وتنتهي جميعها من حساباتها بنفس الوقت عندها فإن زمن التنفيذ 
يساوي إلى الزمن المستهلك بين اللحظة التي يبدأ فيها المعالج الأول ببدء الحساب واللحظة التي ينتهي 
فيها المعالج الأخير من الحساب. 
المعايير المستخدمة في تحديد زمن الئنفيذ: 

Counting Steps خطوات فد‎ ~1 ٠ 


في الواقع قبل تتفيذ الخوارزمية (سواء التسلسلية أو المتوازية) على حاسب ما فإنه من المعتاد توجيه 
التحليل النظري للزمن الذي تطبه لحل المسألة الحسابية من جانب. وعادة يكون هذا عن طريق عد 
عدد العمليات الأساسية أو الخطوات المنفذة من الخوارزمية في أسوأ الأحوال. 


ويمكن وصف هذه الخطوات بدالة حجم الإدخال. وبالطبع يختلف تعريف الخطوة من نموذج نقني إلى 


ن 


وبشكل بديهي فإن عمليات المقارنة والإضافة ومبادلة رقمين هي عمليات أساسية مقبولة عموماً في 
معظم النماذج. كل من هذه العمليات يتطلب عدد ثابت من وحدات أو دورات الزمن في نموذج 
الحواسيب 5152 (الذي يحوي معالج وحيد). 


يمكن الحصول على زمن تنفيذ خوارزمية التوازي بعد نوعين من الخطوات: خطوات الحساب 
وخطوات الاضطراب أو الدوران مء ع١]utاهR.‏ 


خطوة الحساب هي عملية رياضية أو منطقية تنفذ على عنصر بيانات في المعالج. 


من ناحية أخرى فإنه في خطوة الاضطراب ينتقل عنصر البيانات من أحد المعالجات إلى آخر عن 
طريق الذاكرة المقسمة أو عن طريق شبكة الاتصالات. 


من أجل مسألة بحجم ١‏ فإن زمن ننفيذ أسوأً حالة توازي في خوارزمية هو دالة في ١‏ سترمز لها ب 
(ه)ا. كما أن زمن التنفيذ هو أيضاً دالة لعدد المعالجات. 


عموماً الخطوات الحسابية والخطوات الاضطرابية لا نتطلب بالضرورة نفس عدد وحدات الزمن حيث 


أن خطوة الاضطراب عادة تعتمد على المسافة بين المعالجات ونمونجياً تأخذ زمن تتفيذ أقل طولاً من 
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ه 27- الحدود lلدİıi LOWER AND ÛPPER BOUNDS lli‏ 
جديدة تطبيق السؤالين التاليين: 

1- هل هذه هي الخوارزمية المحتملة الأسرع للمسألة ؟ 

2“ إذا لم تكن كذلك كيف يمكن مقارنتها مع الخوارزميات الأخرى الموجودة لنفس المسألة ؟ 
تحصل الإجابة عن السؤال الأول عادة عن طريق مقارنة عدد الخطوات المنفذة من الخوارزمية 
لمعرفة الحد الأدنى لرقم الخطوات المطلوبة لحل المسالة في أسوأً حالة. 
مٹال(1-2): 


لنقل أننا نرغب بحساب حاصل ضرب مصفوفتين )١×١(‏ . بما أن المصفوفة تتطلب ”1 إدخال على 
الأقل فإن هذه الخطوات العديدة مطلوبة من أي خوارزمية ضرب مصفوفات لإثتاج الخرج. الحسدود 
الدنيا في المثال 1-2 تعرف بالحدود الدنيا البدائية أو الواضحة والتي يمكن الحصول عليها من عد 
عدد الخطوات المطلوبة خلال الدخل و/أو الخرج. 


الحدود الدنيا المتطورة أكثر مذكورة في المثال 2-2: 
مثال(2-2): 


تعرف مسألة الترتيب كالثالي: لثأخذ مجموعة من 1 رقم مرتبة عشوائياً. رتب هذه الأعداد تنازليا. 
پوجد هنا !۸ ثبدیل محثمل للإدخالات و !د ڇه! بت مطلوبة للتمييز فيما بينها. لذلك فإن أي خوارزمية 
ترتيب في أسوأً حالة نتطلب ۸ ع٠1 ١‏ خطوة على الأقل لتمييز الخرج الخاص. 

إذا كان عدد خطوات الخوارزمية المنفذة في أسوأ حالة مساوي للحد الأدنى عندها تكون هي الاحتمال 
الأسرع (الأفضل) وإلا سنكون بحاجة لخوارزمية تحسن الحد الأدنى. وعلى أي حال إذا كانت 


الخوارزمية الجديدة أسرع من جميع الخوارزميات المعروفة للمسألة فإننا نقول أنها تؤسس الحد الأعلى 
الجديد على عدد الخطوات المطلوبة لحل تلك المسألة في أسواً حالة. 


أما عن السؤال الثاني فيكون داثماً عن طريق مقارنة زمن التتفيذ للخوارزمية الجديدة مع الحد الأعلى 
الموجود للمسألة . 
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مثال(3-2): 

حتى هذا التاريخ لا يوجد أي خوارزمية معروفة لضسرب مصسفوفتين )١×١(‏ في ”1 خطوة. 
والخوارزمية القياسية المدروسة تحتاج أ" عملية. ويميز الحد الأعلى لهذه المسالة عن طريق 
خوارزمية تتطلب ١“‏ خطوة على الأغلب حيث 2.5>×. 


وعلى سبيل المقارنة يوجد خوارزميات ترتيب متعددة تتطلب على الأغلب ١1‏ ع٠1‏ ¬ عملية ولذلك هي 
الأفضل. 


إن هذه المعالجة للحدود الدنيا والعليا مركزة على الخوارزميات الثسلسلية. وهذه الأفكار العامة نفسها 
تطبق على الخوارزميات المتوازية ولكننا نأخذ عاملين إضافيين في الاعتبار: 


1- نموذج الحسابات المتوازي المستعمل 
2- عدد المعالجات المستخدمة 


٠ه‏ 3- زيادة السرعة Speedup‏ 


عند تقييم خوارزمية التوازي لمسألة معطاة فإنه من الطبيعي تماما فعل ذلك بمدة الخوارزمية التسلسلية 
المتوفرة الأفضل لتلك المسألة. ولذلك فإنه يوجد دلالة جيدة لمراقبة نوعية انامس خوارزمية التوازي 
وهي زيادة السرعة التي تتتجها: 


زيادة السرعة = ۷/× ؛ حیٹ: 
× = زمن تتفيذ أسوأً حالة للخوارزمية التسلسلية المعروفة الأسرع للمسألة 
۷ = زمن تتفيذ أسوأً حالة لخوارزمية التوازي 
ومن الواضح أن زيادة السرعة الأكبر و الأفضل هي خوارزمية التوازي. 
ا ثانياً: عدد المعالجات 


المعيار الثاني الأهم في تقييم الخوارزمية المتوازية هو عدد المعالجات المطلوبة في حل مسألة. حيث 
أنها مكلفة من أجل الشراء والصيانة وتشغيل الحواسيب. 
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عندما يوجد عدة معالجات تنشأً مسألة الصيانة بشكل خاص وكذلك يرتفع السعر المدفوع بشكل حاد من 
أجل ضمان درجة عالية من الوثوقية. لذلك فإن العدد الأكبر من المعالجات في الخوارزمية المطلوبة 
لحل مسألة يجعل الحل أكثر غلاء. 


من أجل مسألة من الحجم ١‏ يكون عدد المعالجاث المطلوبة في الخوارزمية هو دالة ب" ولتكن (۸)م. 
وقي بعض الأحيان يكون عدد المعالجات هو ثابت يعتمد على .١‏ 


3-3-2 ئالثا: حساب الكلفة ACCOUNT OF COST‏ 
تعرف كلفة خوارزمية التوازي على أنها حاصل ضرب المعيارين السابقين: 
الكلفة = زمن التتفيذ × عدد المعالجات المستخدمة 


وبكلمات أخرى : الكلفة تساوي عدد الخطوات المنفذة بشكل جماعي من قبل المعالجات في حل مسألة 
بأسواً حالة. يفترض التعريف أن جميع المعالجات تتفذ عدد الخطوات نفسه. 


إذا لم تكن الحالة كذلك فإن الكلفة هي الحد الأعلى في ناتج عدد الخطوات المنفذة. 


من أجل مسألة حجمها ١‏ فإن كلفة خوارزمية التوازي هي دالة في ١‏ نرمز لهسا ب (١)ء‏ ومنه: 
c(n)=p(n).t(n)‏ 


٠‏ ويمكن أن تأخذ بعين الاعتبار وجود معايير أخرى في حساب كلفة الخوارزميات: 


يمكن أن تعرض الحواسيب الرقمية كمجموعات كبيرة من بوابات الاتصال المنطقية وهذه البوابات 
تبنى باستعمال الترانزستورات والمقاومات والمكثفات (أو الدارات التكاملية والتفاضلية). واليوم تأتي 
البوابات في حزم تدعى رقاقات كمزطء وهي قطع صغيرة جداً من مادة شبه ناقلة تستعمل لصسنع 
البوابات المنطقية والأسلاك التي تصل بينها. عدد البوابات على الرقاقة يحدد مستوى الدمج الموجود 
المستعمل لبناء الدارة. إن أحد التقنيات الخاصة التي ظهرت في الاتصالات بنجاح مستقبلياً في الحساب 
المتوازي هو: مقياس الضم الكبير جداً very large scale integration (VLSD)‏ وفيە يمکن أن 
تتوضع مليون بوابة منطقية تقريباً على رقاقة مفردة ”1 ولذلك فإن الرقاقة قادرة على أن تشمل 
عدد من المعالجات ويمكن أن تجتمع العديد من مثل هذه الرقاقات ابناء حاسب متوازي قوي. 


وعند تقييم الخوارزميات المتوازية في مقياس ال ۷181 غالبا ما تستخدم المعايير التالية: 
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processor area جلlعملا مجال‎ .1 
wire طول السلك طاعمء1‎ .2 
period of the circuit ةرlدئ‎ ةln‎ .3 


4-2 تصميم الخوارزميات المتوازية: 


إن عملية تصميم خوارزمية متوازية هي عملية حركية حيوية ولا يوجد قاعدة معينة للحصول علسى 
خوارزمية متوازية ذات كلفة أصغرية . كما أن هناك العديد من المسائل الهامة لم يستم إيجاد 
خوارزميات متوازية ذات كلفة معقولة لحلها » ولكن هناك بعمض الاستراتيجيات الرئيسية تقود 
للحصسول على خوارزميسات ذات كلففة مقبولة. [IFos,1994], [JeFHk-1997],‏ 
[BrCMal_1992], [JHKi,1990]‏ 


إن الشكل الطبيعي لتطوير الخوارزميات المتوازية هو بالبدء من الخوارزمية التسلسلية ومن ثم تحديد 
الخطوات المستقلة وأخيرا الحصول على الخوارزمية المتوازية. وهذا التحول من التسلسل إلى التوازي 
ينتج غالباً خوارزميات متوازية ذات كلفة منخفضة. ومن أجل ذلك نشا مسألة تحديسد اسستراتيجيات 
للحصول على خوارزميات متوازية فعالة حيث لا يوجد طريقة عامة تعطي أفضل خوارزمية متوازية 
لمسألة معطاة ولكن هناك تقانات تستعمل لهذا الغرض وسنعرض بعض هذه الطرائق والثقانات: 


سنرمز فيما يلي إلى كل من الزمن والمكونات المادية وعدد المعالجات وللزمن ولعدد المعالجات بسآن 
معا ب: 1و 1او ۲ و ٣‏ على التوالي. 


1. التقسيم والتخصيص per4مimp :Divide et‏ 
تعتمد هذه التقانة على تقسيم المسألة إلى مسائل جزئية من نفس النوع ولكن بحجم أصغر ومن شم 
إعادة ترتيب وتجميع الحلول. وهي طريقة فعالة جدأً حيث تسمح بتجزئة المسالة إلى مسائل جزئية 

مستقلة نحل على التوازي وتجمع حلولها للحصول على حل المسألة الاصلية. 


أما بالنسبة لكلفة الحل المتوازي لمسألة حسابية من الترتيب ١‏ وبالتالي من الحجم («)۲# والعمسق 
(1)0 لدینا: 

لتکن آ عدد صحیح يقسم n1‏ ولنكن Hi(n/r)‏ ق Tn/r)‏ (حيث: i=1,2,..۳‏ ( هي کلف حسل ۲ 
مسألة جزئية › ولتكن ()م1 و («)1 هي الكلفة المتوازية الإضافية لحل المسألة الأصلية بعد أن 
يتم حل المسائل الجزئية. لدينا: 
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T(n) s max (Tran) , Ta(nr™) ,...,TAnD )J+T®M ...(1) 
H(n) = max (Hı{o r) + Hر(n/r)‎ +... + H{n/r) , Hm) ...)2( 


تأتي العلاقة (1) من الحقيقتين التاليتين : 


1- استقلالية المسائل . 
2- الحاجة لتتفيذ العمل الإضافي عندما ثحل المسائل الجزئية فقط. 


تأتي العلاقة (2) من الحقيقتين التاليتين: 
1- كل مسألة جزئية تم حلها على التوازي مع الأخريات تحتاج مصادرها المادية الخاصة من 
المكونات الصلبة w2e‏ لh2۲.‏ 
2- الكمية الناتجة من المكونات الصلبة هي العدد الأعظمي بين المصادر المطلوبة لحل جميع 
المسائل الجزئية والمصادر المطلوبة للحصول على الحل الأخير للمسألة الأصلية. 
وعلى افتراض أن جميع المسائل الجزئية منساوية من حيث كلفة التوازي تصبح العلاقتين (1) و 
(2) كما يلي: 
T(n) < T (n/r) + T,(n) ...)3(‏ 
H(n) < max (rH(n/r) ,H.(n) ) ...)4(‏ 
حيث 1)١/۲(‏ و (1)0/۲ هي كلفة المسألة الجزئية من التر تيب .١/٣‏ 
تعتبر هذه العلاقات من 1 إلى 4 هامة من أجل تحليل الخوارزميات المتوازية التي نحصل عليها من 
طريقة التقسيم والتخصيص. 
2. طريقة استخدام المتجه 101) ھ۲1 :Vec)٥‏ 
تبدأً هذه التقانة من تحليل المسألة وإنتاج الخوارزميات التي تعمل على بنى المعطيات التي تتناسب 
مع حسابات المتجه (المتجهات والمصفوفات). وهذه التقانة هامة بشكل خاص في النموذج 510 
خاصة عندما يكون من المناسب العمل على متجه من ١‏ ترتيب بالإضافة إلى 1 كمية غير متجهة. 
3. تكرارات lلمتجlqٽ :vector iterations‏ 
قام بوضع هذه التقانة ه٣1‏ وآخرون من أجل حل الجمل الخطية المثلثية. حيث تبدا باسستخدام 
الخوارزميات التسلسلية المباشرة وتبنى منها الطريقة التكرارية المتوازية وهكذا.. 
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إذا أخذنا الطريقة التعاودية لحساب عناصر مصفوفة مثلثية بالشكل التالي: 


XK TA. 
XZ a; — (b;@; / X;-1) ,2S1Sn 
عندئذ يمكن أن نحصل على التكرارات التالية وفق طريقة غاوس:‎ 
x = 
2ı 


gj ¬ (be; / xı" )‏ = 0 
عندماً ز هي رقم التكرار. 
يمكن أن تكون هذه التكرارات شعاعية أي أنه يمكن أن نفترض تعديلا للشعاع × حيث:0 <ز. 
كما نجد أنه في الخطوة الأولى (0=ز) كل عنصر في الشعاع “× تحوي القيمة ,2. 
في الخطوة الثانية يحوي العنصر رقم 1ل × القيمة: 
(bei / x)= ai — (bei / a) ,  i=12,...,n‏ - 
عندئذ يمكن أن تعدل كل العناصر في × بآن واحد معا. وهكذا يطبق المبدأ نفسه على التكرارات 


:Recursive doubling المضاعفة التعاودية‎ .4 


وهي تتألف من تحويل البيان الحسابي من مثل البيان المعروض في الشكل (1-2 -أ-) إلى بيسان 
من الشكل(1-2 -ب-) وهذا يمكننا من الحصول على بيان تكون فيه كلفة التجوال (درجة التعقيد) 
تابع أسي (لوغاريتمي) من بيان فيه كلفة التجوال (درجة التعقيد) تابع خطي. 


O 


a 4 0‏ ا 
e € e‏ 
TE WT A ¢‏ 
OS‏ 
مر 
O O‏ 
الشكل(1-2) أ- بيان بدرجة تعقيد خطية الشكل(1-2) حب“ بيان بدرجة تعقيد لوغاريتمية 


وفي هذا الشكل من أجل 8=" نلاحظ أن عمق البيان الحسابي في الشكل (1-2 -أ-) هو 7 وفي 
الشكل (1-2 -ب-) هو 3. 
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مثال(4-2): 
لنأخذ حساب ال "× حيث “2= من أجل عدد صحيح K‏ . ولئأخذ الخوارزمية التالية: 


Begin 
S4x; 
for 14-1 until n-I do 
sS s۴x; 
end. 


نلاحظ أن البيان الحسابي الناتج عن هذه الخوارزمية له درجة تعقيد خطية (أو عمق خطي) كما نجد 
ذلك موضحاً في الشكل (2-2-أ). 


أما إذا كان الحساب يتم بالطريقة التالية: 


Begin 
S4x; 
for i-i until k do 
sS s*s; 
end. 
عندئذ نحصل على البيان الموضح في الشكل (2- 2-ب) وهو بدرجة تعقيد لوغاريتمية.‎ 
۴ * 
ر‎ N 
ر‎ N 4 # * ر‎ O 
e 0 x 0 
e 8 
Ox XO OX¥ XÛ OX XO O¥ XO AS: 
ر‎ 0 
6 6 
الشكل (2-2-أ) الشكل (2-2-ب)‎ 


يوضح الشكل (2-2-) بيان حسابي من أجل حساب تسلسلي ل × بدرجة تعقيد خطية ويوضح الشكل (2-2-ب) 
بيان حسابي من أجل حساب تسلسلي ل × بدرجة تعقيد لوغاريتمية 
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تملك البيانات الحسابية لخوارزميات تسلسلية من أجل حسابات رياضية غادة لبنية الموضحة في الشكل 
(1-2-أ) » ولا يتضح دائماً فيما إذا كانت الاستقلالية بين العمليات تعود للخوارزمية أم لأساس 
المسألة. ففي حالة اعتمادها على أساس المسألة لا يمكننا التغبير غالياً. أما في حالة اعتمادها على 
الخوارزمية عندئذ يمكننا أن توصل إلى تقريب للمضاعفة التعاودية الممكنة بتحليل دقيق للمسألة. 


يمكن أن نعتبر أن المضاعفة التعاودية هي حالة خاصة من التقسيم والتخصيص. إذ أن البيسان في 
الشكل (2-2- ب) يفترض أن القيمة "× تساوي ناتج "× * ”× وهذا بدوره يعني أن المسألة وم (أي 
الحساب ل"× ) يمكن أن يحلل إلى رمم * رص أفضل من × * 2رم0. ويشكل أعم نتألف المضساعفة 


التعاودية من الحصول على خوارزمية متوازية بتكرارات بدءا من الخوارزمية التسلسلية بكلفة (د)ء 
S(M < S(n-r) F fn)‏ 


حيث ۲ ثابت و (0)؟ دالة متزايدة في .1١‏ 
5. تخفيض عدد lأllanجlت‏ ocessorثp :Reducing the number of‏ 


حيث يمكن في بعض الأحيان إنقاص عدد المعالجات الكبير باستعمال خوارزمية متوازية وذلك 
بزيادة زمن التنفيذ بواسطة عامل ثابت. ولئرى كيفية تحقق هذا الدف. لنفشرض أن لدينا 
خوارزمية متوازية تأخذ كلفة زمئية (” 0)1٥‏ وتستعمل («)0 معالج. ولنفترض أيضاً أن 
أفضل خوارزمية تسلسلية متوفرة تحل المسألة نفسها لها كلفة خطية. وهذا يؤدي إلى أن 
الخوارزمية المتوازية لها فعالية (" عه[/0)1 وهي بعيدة عن الكلفة الأمثية. في بعمض 
الأحيان يمكن تحويل خوارزمية متوازية بمثل هذه الفعالية إلى خوارزمية متوازية أخرى بزمن 
( عه0)1 وعدد المعالجات (” عها/0)n‏ ومنه بفعالية (0)1 » ومنه ينتج ما يلي: يجب أن 
تقسم المسألة من الحجم ١‏ كما في طريقة النقسيم والتخصیص إلى ۸ عه!ا/" مسأالة جزئية 
بحجم ۸ عه! » عندئذ تحل كل مسألة جزئية بواسطة معالج مفرد باستعمال أفضل خوارزمية 
تسلسلية متوفرة (خطياً مع ۸" ع٠!).‏ إذا وصل حل كل من المسائل الجزئية ال ۸ ع٥ا/ه‏ إلى 
المسألة الابتدائية من الترتيب 1" 18" عندئذ نستطيع أن نستعمل الخوارزمية المتوازية بأخذ 


زمن: 


{log (nog n) = O (log n)‏ 0 مع ¬ n/10g‏ معالچج 
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وبشكل عام يجب أن تطبق المعادلة التالية على المسألة وم » من أجل K‏ يقسم ۸: 
P, = k Par + Px ...)5(‏ 
تعني العلاقة (5) أن المسألة رميمكن أن تجزأً إلى × مسألة جزئية ررم من نفس النوع » تولد حلولها 


مسالة »ص يمكن أن تحل بعد أن يتم حل جميع المسائل الجزئية ال K‏ . لنفترض أنه لكي نحل وم يوجد 


1- خوارزمیة متوازیة ہ۸ تمثل ب (۵)م۸٣‏ و (۸)رړ٤‏ 
2“ خوارزمية تسلسلية ۸ مع كلفة (مثلا عدد العمليات ) (1۸)۸" 


لنفترض أن (۸)؟ )١(‏ ۲۸ = (۸)رے (٥)مے‏ حیث (۸)؟ دالة متزایدۃ ب ۸٢۔‏ 


ولذلك فإن فعالية الخوارزمية م4 تعطى بالعلاقة 1/6)١(‏ وهذا يعني أن الخوارزمية تقوم باستعمال 
إضاقي (زائد) للمصادر. 


ومنه يمكننا أن نسنتتج ونفترض دالة (۸)ع كما پلي: 


0(1)= g(n) <n 1 
Ta,(g(n)) Ha(g(n)) = Ta() °2 


نستبدل K‏ ب (۸)ع في العلاقة (5) ونحصل على ما يلي: 
P(n) = g(n) Pwgcn) T Pam ...)6(‏ 


من العلاقة (6) نجد أنه يمكن حل مم كما يلي: 


1 حل رہ)رمص بمعالج مفرد باستعمال خوارزمية ۸. 
2. حل P(r)‏ باستعمال خوارزمية متوازية مھ 
يمائل هذا الإجراء خوارزمية متوازية جديدة *۸ تمثل ب *1 و H[*‏ تعطى بالعلاكة: 
T*(n) = Tap(g(n) + Ta(n/g(n)))‏ 
H*(n) = max { Hap(g(n)) , g(n) }‏ 
عندئذ فإن فعالية *4 هي (0)1مما ينتج المعادلات التالية المطبقة على (م)ع: 
g(n) = O(Hap(8(n)))‏ 
Tap(g(n)) = O(Tap(g(n)))‏ 
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5-2 كفاءة خوارزمية: 


نعرف كفاءة أو كلفة خوارزمية بأنها ناتج ضرب عدد المعالجات التي تستعمل لإنجاز العملية وزمهن 

][WaCDaK[, [TLCP, 1993] , [Hro,1997[‏ إن حل الجمل الكبيرة من المعادلات الخطية 
يمكن أن يكلف كثيراً على الحاسب. وحتى نعرف لماذا دعنا تنجز عملية عد لخوارزمية لهسا كود 
معطى. سنعد فقط عمليات الضرب والقسمة (العمليات الطويلة) لأن لها أكبر زمن مستهلك» بعد ذلك 
نجمع عمليات الضرب والقسمة معا حتى ولو كانت عمليات القسمة أبطأً من عمليات الضرب. 


مثال(5-2): 


لنأخذ خوارزمية كوه الذي نقوم فيه بحل جملة معادلات خطية ومن ثم نقوم بحساب الكلفة وذلك 
بعد العمليات الطويلة فيهء وفيه مصفوفة الأمثال و٠(4)‏ ومصفوفة الثوابت م(1) وهناك مصفوفة 
مساعدة لتحديد مواقع العناصر هي م(50) . 


وفيما يلي تعرض خوارزمية((:1),( 3),١)5ءا60‏ وفق التسلسل: 


for i=1 to n do 
li i 
smax *” Û 


for ]=1 to n do 
smax *” max(smax , |aj|) 


end for 
5ı TT smax 
end for 
step2: 
for k= to n-1 do 
rmax*Û 
for i=k to n do 
r“ [Aki | 
if (t> rmax) then 
rmax “r 
ا‎ 
end if 
end for 
1 آ4‎ 
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for i=k+} to n do 
xmult“laı; xak 
ak xmult 
for j=k+1 to n do 

Ari,j 7 Qi j-(xmultdarj 

end for 

end for 

end for 


وفيما يلي نحسب كلفة التنفيذ: 


في الخطوة 1: يتطلب اختيار العنصر المحوري حساب ١‏ نسبة وهذا يعني: ١‏ مقسوم. ومن شم مسن 
أجل الأسطر ما,..ردار! تبداً أولا بحساب الضرب ومن ثم نطرح من السطر :1 مرات الضرب وهي 
السطر ,1. أما الصفر الذي ينشاً من هذه العملية فلا يحسب. ومنه يتطلب الحذف 1-1 مضروب فسي 
کل سطر. 

إذا ضمنا حساب المضاريب فإننا نجد ۸-1 عملية طويلة (مقاسيم ومضاريب) في كل سطر. ونجد أن 
هناك 1-1 سطر يجب معالجتها لنحصل بالنتيجة على (1-1)." عملية. إذا أضغنا كلفة حسأب النسسب 
فإن النتيجة هي ”1 عملية مطلوبة من أجل الخطوة1. 

الخطوة التالية مثل الخطوة 1 ما عدا أن السطر ,1 لا يؤثر بل على العكس فإن عمود المضاريب قد 
نشا وخزأن في الخطوة1. 

لذلك فإن الخطوة 2 ستتطلب ”(1-1) مضروب ومقسوم تتم معالجتها على الجملة مع السطر ,! بدون 
الحمود1. 

باستمرار هذه المعالجة نحصل على أن نتيجة عدد العمليات الطويلة للججراء #كامG‏ هي: 


n? +(n-1)+(n-2J+. ..+4°+3°+2?=n/6(n+1(2n+1)-1 x13 
. 1/3 لاحظ أن عدد العمليات الطويلة في هذا الإجراء ينمو إلى‎ 
نظرية(1-2):‎ 1-5-2 


إن الحذف المتقدم المتجائس لخوارزمية حذف غاوس مع تخفيض المحاور الجزئية إذا طبقت فتط على 
مصفوفة معاملات ٠*١‏ تحل تقريبا ب 1/3 عملية طويلة (ضرب وقسمة). والحل من أجل × يحتاج 
”م عملية إضافية طويلة. 
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لنقوم الآن بإيجاد خوارزمية متوازية لمسالة حل جملة معادلات خطية وسنستخدم طريقة غساوس 
جوردان حيث أنها الطريقة التسلسلية الأكثر شيوعاً لحل .هذه المسألةء وهي تتألف من حسذف جميع 
المجاهيل × ما عدا ×من المعادلة 1 وبذلك نحصل على الحل مباشرة. 


[64-1989ء5] الخوارزمية المتوازية لطريقة غاوس جوردان مصممة لئتفذ على حاسب C°CRِ٤W‏ 
SM SMD‏ ب n+‏ معالج يفترض بأنها مرتبة في مصفوفة (2*)۸+1. تعطسى الخوارزمية 
کإجر اء .S[MD GAUSS JORDAN‏ ونرمز فیھا لہ ;ا یہ 1ہہ. 


:SIMD GAUSS JORDAN (A,ۆ,x)‎ ءIرڄإl‎ 2-5-2 


stepl: 
for j=1 to n do 


for i=1 to n do in parallel 
for k=] to n*1 do in parallel 
if (i #j) then 
Aik *” Aik ~ (j/AjjJAjk 
end if 
end for 
end for 
end for 


step2: 
for i=] to n do in parallel 


Xj * @in+ı/aii 
end for 
نلاحظ أن الإجراء يسمح بعمليات القراءة المتعددة لأكثر من معالج واحد وذلك عندما يحتاج لقراءة زه‎ 


و ززة و »زه بآن واحد. 
" حساب الكلفة التنفيذية: 


الخطوة 1 تتألف من ١‏ تكرار بزمن ثابت › والخطوة 2 تأخذ زمنا ثابتا. لذلك (م)0=(م)). طالما أن 
()0-,ہ)۴ فإن (م)0-(,)٥.‏ على الرغم من أن هذه الكلفة تصل إلى عدد الخطوات المطلوبة 
للخوارزمية التسلسلية لخوارزمية غاوس جوردان إلا أنها ليست أفضليةء وذلك لأن زمن التنفيذ الكلي 
للحل التسلسلي لجملة المعادلات الخطية ا=×ه هو ()0 حيث 2>×>2.5. 
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6-2 مقارنة بين الخوارزميات التسلسلية والمتوازية: 


]R۸2-1993[ , ]J 81) ,1997[‏ يفيد تحليل الخوارزميات في مقارنة خوارزميات حسل مساألة 
معينة فما نريد الوصول إليه هو مهما تكن الآلة التي سنتفذ الخوارزمية ومهما تكن لغة البرمجبة 
المستخدمة فإن : لنفرض أن لدينا خوارزميتين A‏ و 8 تتفذان المهمة البرمجية نفسها فإن الخوارزمية 
۸ أفضل من الخوارزمية 8. 


بعد تحديد تعقيد خوارزمية كتابع لحجم المعطيات يمكن دراسة سرعة تزايد هذا التأبع عندما يزداد 
حجم المعطيات. تفيد هذه الدراسة في تحديد فعالية الخوارزمية من أجل معالجة معطيات كبيرة الحجم 
إذ يمكن في بعض الحالات أن نجد فروقا هائلة بين خوارزميتين من حيث التعقيد الزمني. 


في معظم الحالات نكتفي بتقريب بسيط لتابع التعقيد الزمني لمعرفة فعالية الخوارزمية ولمقارنة 
خوارزميتين. فمثلاً عندما نكون ١‏ كبيرة يكون من غير المهم معرفة ما إذا كانت خوارزمية معينة 
تحتاج ل ١‏ أو 5+«عملية. مما يدفعنا إلى إيجاد ما يسمى مرتبة كبر تابع حيث تتم مقارنسة 
الخوارزميات على أساس مرتبة الكبر لتوابع التعقيد الزمني. 


:)1-2( نتيجة‎ ١ 


بفرض آن عدد المعالجات المستخدمة لإنجاز عملية في إحدى خوارزميات المعالجة المتوازية هو م 
وبفرض زمن تنفيذ الخوارزمية هو ) » وجدنا أن كلفة الخوارزمية ٣‏ هي :1*۶=]°. 

في الآلة التسلسلية عدد المعالجات واحد وكلفة الخوارزمية تساوي زمن التنفيذ تماماً ومنه 1*)=]. 
ومنه فإن الخوارزمية المتوازية بالكلفة الأمثية هي الخوارزمية التي كلفتها : 

()0-(زمن التنفيذ التسلسلي)0 


* نتيجة (2-2): 


إذا لم تكن الخوارزمية المتوازية ذات كلفة أمثية فإئه يمكن تحسين الخوارزمية من خلال تخفيض 
زمن التنفيذ التقريبي أو تخفيض عدد المعالجات. 
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1-6-2 مفاهيم أساسية لبناء خوارزمية متوازية بكلفة أمثلية: 


[4557,1998] ليكن زمن تنفيذ الخوارزمية التسلسلية لإنجاز مهمة بحجم " هو («)0 وزمن 
تنفيذ الإصدار ألمتوازي لهذه الخوارزمية هو (۸ عه!ا)0 حيث: ١‏ عدد المعالجات المستعملةء كل منها 
يمسك عنصر بيانات واحد. ولذلك فإن الكلفة هي: 


0st = n0)10g n( = O)nlog n(‏ هذه الكلفة ليست أمثلية. وللحصول على خوارزمية بكلفة أمثية 
نحتاج أحد أمرين : إما تخفيض زمن النتفيذ (0)1 أو إنقاص عدد المعالجات إلى «عه!ا/" ولذلك فإن 
ناتج الضرب ل ۸ 1/10 مع ( 0)10 يعطي (0)۸. 


لیکن کل معالج يأخذ ۸" ع٥1‏ عنصر بيانات. فإذا كانت العملية التسلسلية خطية في عدد عناصر البيانات 
عندها كل من ال "٥١2 "١‏ معالج سينجز عملية تسلسلية على التوازي على كل من عناصر بياناتها 
ال "١‏ عه!في زمن (” عه0)1. إضافة إلى أن المعالجات ال ”عه[/م سنتجز الخوارزمية السسابقة 
(غير الأفضلية) على النتائج "١‏ عه1/" من الخطوة التسلسلية في: 


1og(n/log n)= log n - log(log nJ=O(log n) 


ومنه فإن كلفة كل خطوة هي (ہ ڇه0)1 والكلفة هي: (ہ)0 = (۸ عه۸(0)1 ع٠1/1)‏ وهو المطلوب. 
7-2 خواص الخوارزميات المتوازية: ٠٥۷٥۹‏ 
هناك خصائص هامة نرغب في الحصول عليها في الخوارزمية المتوازية. 


1. عبد المعالجات؛ الخاصية الأولى هي عدد المعالجات المستخدمة في الخوارزمية. بففرض 1 
هو حجم المسألة التي نريد حلها فإن: 


أ ۴)١(‏ يجب أن تكون أصغر من ١‏ : إنه من غير الواقعي أن نفترض أن المعالجات أكثر 
من مفردات المعلومات خاصة من أجل قيم كبيرة جدا ل .١‏ ولذلك من المهم أن تكون 
(۴)۸ تعبر عن دالة أسية أو لوغاريتمية في n‏ وھذايعني: |> .P(n)=* ; 0 <x‏ 

ب- ۴)١(‏ يجب أن تكون متكيفة 1۷8امهلة: في الحساب بشكل عام وفي الحساب المتوازي 
بشكل خاص نحتاج إلى قوة حسابية إضافية إذ أنه دائماً يمكن أن تطرح مسائل أكبر وأكثر 
تعقيدا مما كان محتملاً قبل ذلك. وهذه المسائل الأكبر قد تجعل الخوارزمية عديمة التففع 


تماما. وتستخدم الخوارزميات عدد المعالجات على أنها دالة أسية أو لوغاريتمية في "١‏ 


57 


All Rishts Reserved - Library of University of Jordan - Center of Thesis Deposit 


1/2 ا 
مثل ۸ , 1 عهاوالتي قد تكون غير مرضية بسبب عدم مرونتها. . مانحتاجه هو 
E A‏ 
الحاسب الموجود. 


2. زمن التففيء الخاصية الثانية هي زمن تنفيذ أسوأً حالة للخوارزمية المتوازية. 
2 («)) يجب أن تكون صغيرة : الدافع الأساسي لبناء الخوارزمية المتوازية هو 
تسريع العمليات الحسابية. ولذلك فإنه من المهم أن تكون الخوارزميات المتوازية 
التي نصممها أسرع بشكل مميز من أفضل خوارزمية تسلسلية للمسألة التي بين 
أيدينا. 
ب“ (ہ)] یجب ان تكون متكيفة 1۷#ام2ل2: فمثلا قد يرغب شخص ما أن يملف 
SS‏ عدد المعالجات المستعملة أكجر. فمن 
المرغوب ا ن («)ا تتغير بشكل متناسب (عكسيأً) مع (")م بدون مجموعة الحدود 
ن (n)م.‏ 


3. الكلفة : أخيرأ نرغب بالحصول على خوارزميات متوازية يتحقق فيها : 
C(n) = t(n) x p(n)‏ 
والتي دما تتاب الحد الأننى المعروف على عدد العمليات التسلسلية المطلوبة في ألسوأ حالة 
لحل المسألة. وبمعنى نى آخر الخوارزمية المتوازية ستكون بأفضل كلفة. 
إن اجتماع الموضوعات السابقة عادة يكون صعباً وفي بعض الأحيان مستحيلا. وبشكل خاص عندما 
تکون المعالجات المتعددة موصولة عن طريق شبكة اتصالات حيث أن الشكل الهندسي للشبكة بفرض 
حدودا على ما نستطيع إتمامه عن طريق الخوارزمية المتوازية. ولكن الأمر مختلف تماما عندما تكون 


الخوارزمية منفذة على حاسب متوازي بذاكرة مقسمةء فمن غير المعقول هنا أن نصر على هذه 
الخواص المعطاة إذ أن النموذج يكون قوياً ومرناً. 
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13 خوارزمية التحقق من الانتهاء من التوزيع (خوارزمية النشر): 


لقد رأينا في الفصل الأول أنه في النموذج S]M5؟ ٤۸W SM‏ لا يمكن الوصول المحدد إلى نفس 
موقع الذاكرة لمعالجين معا بآن واحد ومع ذلك فقد يكون من الضروري أن تقرأً عدة معالجات عنصر 
بيانات محدد محفوظ في موقع معين من الذاكرة المشتركة. 


بمعنى آخر فقد نحتاج أحيانا إلى نشر عنصر بيانات ما على جميع المعالجات في الحاسب المتوازي 
من أجل استعماله من قبلها جميعا في الوقت نفسه. 


ومن الواضح أن المحاكاة الفعالة لهذه العملية لا يمكن إنجازها في خطوة واحدة على نموذج ٤۸٤ W‏ 
ونحتاج من أجل تلك المحاكاة إلى وضع إجراء ينفذ هذه المهمة. سنقوم أولاً بتوضيح مهمة هذا 
الإجراء على مثال. 


مثال (1-3): 


ليكن لدينا ملف كبير جدأً يتألف من ١‏ إدخال منفصل وانفترض أن الملف غير مرتب بأي طريقة. فإذا 
أردنا البحث عن عنصر معين مثل × في هذا الملف على حاسوب من lلiمgذج EREW SM SIMD‏ 
مع N‏ معالج حيث N > ١‏ » عندئذ نحتاج إلى نشر هذا العنصر على جميع المعالجات › لنرمز 
للمعالجات ب: م P1,P2,..,۴‏ 


تتم عملية النشر باستعمال الإجراء 6١[1؟0۸S٥٤(8۸010‏ الذي يقوم بما يلي: 


١ -4‏ يقرا × ویبلغ رم 
9 بنفس الوقت ,رم تبلغ بطرم على التوالي 
6- بنفس الوقت وم.دم,2ط,رم تبلغ وط,7م,6م,ومط على التوالي 


تستمر هذه العملية حتى تحصل جميع المعالجات على × حيث يتضاعف عدد المعالجات في كل مرطة 
مما يعني أن هذه العملية تتطلب ۸ ع٠1‏ خطوة. لنفترض أن جميع المعالجات تحتاج عنصر بيانات 
معين في لحظة ما خلال تتفيذ الخوارزمية وليكن هذا العنصر محجوز في الموقع © من الذاكرة. نتم 
محاكاة عملية القراءة المتعددة هذه على حاسب ٤W‏ ۸ع عن طريق عملية lلئٹضر Broadcastiıg‏ 
والتي نعرفها بالإجراء .8۸005٤٥487‏ يفترض هذا الإجراء وجود مصفوفة ۸ طولها × في 
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الذاكرة » حيث تكون هذه المصفوفة فارغة في البداية ويستعملها الإجراء كمكان إنشر محتويات 1 إلى 


المعالجات يرمز لها ب (A۸)1.ء‏ 


خوارزمية الإجراء 8۸010€۳4S1)0,N,4(‏ (خوارزمية النشر): 


الخطوة1: - المعالج ,۴ : 
- اقرأً القيمة في 5 
2- خزنها في الذاكرة الخاصة ب ۴ 
3~ اکتبها في (۸)1 
الخطوة2: - من (1=0( إلى (iog N-1)‏ 


من (1+'2=ز) إلى (""2) 
المعالج Pj‏ 


- اقرا القيمة في (2-ز)۸ 
2- خزذها في الذاكرة الخاصة ب ز۴ 
3- اکتبها في (۸)j۔‏ 


Void BROADCASTO,N,A) 
{ 
stepl: processor P1] 


(1) reads the value in D 
(il stores it in its own memory , and 
(ii) write itin A(1); 


Step2: for (=0 ,1i < log N-1 ,it+) 
for (j=2+1 , j < 2", j++) in parallel 
processor Pj 
û reads the value in A(j-2, 


{i} stores it in its own memory , and 
(iii) writes it in Aj); 
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نوضع عمل الإجراء 8۸0۸0٥۸8‏ في الشكل (1-3) من أجل 5= , 8= 


E 


Py Py, Py; Py Ps; P6, PF Ps 


شكل (1-3 ()) تتفيذ الخطوة1 


شكل (1-3 (ب)) تنفيذ الخطوة 2 عندما (0=:) 


1 2 3 4 Š5 6 F7 8 


P P, P; P4 Ps, Pé P; Ps 


شكل (1-3 (ج)) تتفيذ الخطوة 2 عندما (1=ن) 
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P, Py P; Py Ps; Pé, P; Ps 


شكل (1-3 (د)) تنفيذ الخطوة 2 عندما (2<:) 


عندما ينتهي الإجراء تكون جميع المعالجات قد خزنت قيمة 0 في ذاكرتها المحلية الخاصة من أجل 
استخدام آخر. طالما أن المعالجات المتعددة قد قرأت ( مرتين في كل تكرار فإن الإجراء ينتهي في 
زمن .0)]og N)‏ 


إن الذاكرة المطلوبة من الإجراء 8۸040٣۳481‏ هي مصفوفة طولها × وبكلام أدق مصفوفة من 
نصف ذلك الطول إذ انه في آخر تكرار للإجراء تكون جميع المعالجات قد استقبلت القيمة في © ولا 
تحتاج أن تكتبها مرة أخرى في ۸ (انظر الشكل 1-3 (د)). 


يمكن للإجراء 8۸040٥0458‏ بسهولة أن يتكيف لمنع الكتابة الأخيرة ومن أجل ذلك يستعمل ' 
مصفوفة ۸ بطول .N/2‏ 


23 خوارزمية مراقبة الانتهاء: 
عندماً تعمل إحدى الخوارزميات على حاسب متعدد المعالجات ويقوم كل من هذه المعالجات بمهمة 
معيئة للوصول إلى نتيجة ما عندئذ فإتنا قد نحتاج أحيانا إلى معرفة ما إذا أنهت هذه المعالجات مهمتها 


لناخذ موقع ؟ › يحتوي هذا الموقع على قيمة منطقية تحدد فيما إذا أتم أحد المعالجات المهمة المطلوبة 
وبالتالي تنهي باقي المعالجات عملها. في بداية الأمر تأخذ ؟ القيمة مءإة؟ وعندما ينهي المعالج مهمته 
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فإنه يضع في ؟ القيمة عدا » وفي كل خطوة تقوم جميع المعالجات بفحص قيمة ۴ فإذا كانت عبر 


في حالة الحواسيب من النموذج E۸8۷‏ ئلاحظ أن هذه العملية تحتاج إلى × عه! خطوة لنشر قيمة ؟ 
في كل مرة تحتاج إليها المعالجات وهذا يزيد زمن التتفيذ. أما في تموذج الحواسيب ۷٤۸ح‏ فإن 
عمليات القراءة المتعددة مسموحة وبالتالي تأخذ خطوة واحدة لجميع المعالجات من أجل الحصول على 
قيمة ؟ مما يخفض من زمن التتفيذ. كما نلاحظ أنه ربما ينهي أحياناً أكثر من معالج مهمته في آن 
واحد فيحتاج عندئذ أكثر من معالج إبلاغ النجاح في الوقت نفسه وهذا يعني أن اشين أو أكشر مسن 
المعالجات ستحاول الكتابة في الموقع ؟ في الوقت ذاته وهذه العملية ممكنة في نموذج الحواسيب 
CROW SM SIMD‏ فقىذ. 


33 خوارزمية سبر التفرع الشجري (خوارزمية البحث على الشجرة): 


]6C.0,1993[, ]KM[ص,1982[ , [CSJJ,1981|‏ يعتبر البحث أحد العمليات الشائعة في 
مجال الحسابات. ويستخدم في التطبيقات التي نحتاج فيها لمعرفة فيما إذا كان عنصر ما ينتمي إلى 
قائمة أو بشكل أعم تكرار في معلومات حقل مرتبطة بذلك العنصر. 
تتوضح مسألة البحث بشكل قاعدة عامة كما يلي: 


تعطى متسلسلة ہ5 2 = 5 من الأعداد الصحيحة وعدد صحيح × والمطلوب تحديد فيما 
إذا كان »5 = × حيث »5 عنصر من 5. تحل هذه المسألة في الحسابات التسلسلية بمسح المتسلسلة 5 
ومقارنة العنصر × مع عناصرها المحددة وتستمر هذه العملية حتى نجد عنصراً صحيحاً مساوياً ل 
أو تعود العملية بالفشل. 


لنفترض الآن أن لدينا حاسب 511۸0 باتصال شجري مع ١‏ مستوى من أجل البحث في ملف فيه ا٣‏ 
سجل. مثل الشجرة المبينة في الشكل من أجل 16 = ". 


تختلف مهام المعالجات في هذا النموذج حسب توضعها في الشجرة : 


2 تخزن كل ورقة في الشجرة سجل واحد للملف الذي نبحث فيه. 
- يلقى الجذر الإدخال من العالم الخارجي ومن ثم يمرر ناتج الخرج الذي يتلقاه من أبنائه إلى 
العالم الخارجي. 
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- أما من أجل العقد الوسطى فكل منها يستطيع القيام بما يلي: 


1. تتلقى العقدة الوسطى إدخالاً واحداً من الخلف (الأب) ويصنع منه نسختين يرسل 
واحدة إلى كل من أبنائه. 
2. يتلقى إدخالين من ابنيه يقارنهما ويرسل النتيجة إلى والده. 
دخل/خرج () 
الجذر 
عقدة وسطية 


TE: 
ا ا‎ 


/الشكل (2-3)/ البحث على حاسب باتصال شجري 
سنوضح الآن عملية الاستعلام والحفظ للملف المخزن في الأوراق فيما يلي: 
1-3-3 خوارزمية الاستعلام: 
ليكن لدينا عدد صحيح × معطى والمطلوب البحث في سجلات ملف بالاعتماد على الحقل ك من أجل 
× وتحديد فيما إذا كان هناك قيمة في لم51,52,...5) = 5 مساوية ل × › يحتاج هذا الاستعلام فقط 
جواباً نعم أو لا وهذا شكل القاعدة العامة للاستعلام. 
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المرحلة1: يقرأ الجذر × ويمررها إلى ولديه. وبدورها هذه ترسل × إلى أولادها » تستمر العملية 
حتى تصل نسخة من × إلى كل ورقة. 


المرحلة 2 تقارن كل الأوراق بآن واحد الحقل £ للسجل المخزن فبها مع ×: إذا كان مساويا فان 
الورقة نتتج 1 كخرج و إلا فإنها تتتج 0 . 


المرحلة3: يندمج خرج الأوراق بشكل متقدم في الشجرة: كل عقدة متوسطة تحسب العامل 0۸ 


(مثال: 0 = 0 ه0 , 1= 0 10۲ , 1 = 0١1‏ 1 وتمرر النتيجة إلى والدها. تستمر العملية 
حتى يتلقى الجذر خانئين تحسب لهما العامل 0۴ المنطقي وينتج إما 1 للإيجاب أو 0 للنفي. 


نلاحظ أن مثل هذا الاستعلام تتم الإجابة عنه في زمن (۸وه!)0. 
مثال (2-3): 


لتكن (19,17, 25,14,36,18,15,17) = 5 و17 = ×. سذقوم بتوضيح المراحل الثلاثة فيما يلي 
في الشكل: 


المرحلة(1) /أ/ 
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المرحلة (3) إجد/ 


شكل(3-3) /البحث في متسلسلة من 8عناصر باستعمال الشجرة/ 


لنفرض الآن أن عدداً من هذه الاستعلامات وليكن ¶ يصطف بانتظار المعالجة. ويمكن أن تمرر 
مباشرة إلى أسفل الشجرة طالما أن الجذر والعقد الوسطى شاغرة لمعالجة الاستعلام التالي حالما تقوم 
بتمرير الاستعلام الحالي إلى الأمام لأبنائهم. بالمقابل نجد أنه بالنسبة للأوراق حالما تنتج نتيجة أحد 
المقارنات فإن الورقة تصبح جاهزة لتلقي قيمة جديدة ل × وتمرر النتائج أيضأً مباشرة للأعلى. 
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يستطيع الجذر والعقد الوسطى حساب العامل ٠٣‏ المنطقي للزوج التالي من البتات حالما ينتهي من 
الزوج الحالي ٠‏ وبالتالي نجد أن الجذر والعقد الوسطى تتلقى تدفق البيائات بشكل منحدر 
(للاستعلامات) وبشكل صاعد (للنتائج) بآن واحد ء وقد افترضنا أن كليهما يمكن أن يعالج في وحدة 
زمنية مفردة وعلى الرغم من حفظ كليهما لتدفقات حركة البيانات › فإن المعالج يمكنه أن يعمل 
بالتناوب من أحد الاتجاهات إلى الآخر. مما يعني أن عملية الإجابة عن الاستعلام الأول الذي سينتج 
في الجذر تأخذ زمنا قدره: ٠(‏ وها)0 » وبالتالي فإننا نحصل على الإجابة عن الاستعلام الثاني من 
وحدة الزمن التاليةء وهكذا فإننا نحصل على الإجابة عن الاستعلام الأخير بعد )٩-1(‏ وحدة زمن من 
الإجابة الأولى. 

أي أن نتيجة ال (¶) إجابة يمكن أن نحصل عليها بكلفة زمنية هي: (0)4+ (۸ وها)0. 


سنقوم الآن ببعض التغييرات على القاعدة من أجل الاستعلام المناقش حتى الآن: 
1 .خوارزمية الموضع: 


إذا تجح الاستعلام وكان العنصر »5 مساوياً ل × فإن المطلوب أن نعرف الدليل ۸. لنفترض أن 
الأوراق مرقمة من 1 إلى ١‏ وأن الورقة أ تحوي إ5. وبعد مقارنة المعالجات الأوراق للبيانات مع × 
نجد أنه إذا كان 5;=١‏ نتتج الورقة أ الزوج (أ,1) و إلا فإنها نتتج (أ,ه). 


أما بالنسبة للعقد الوسطى والجذر فهي تعمل كما يلي : 


إذا وصل الزوج (أ,1) و(ز,0) عندها يرسل الزوج (,1) للأعلى. و إلا إذا كان كلا الزوجين 
يحويان 1 كعنصر أول أو إذا كان كلا الزوجين يحويان 0 كعنصر أول عندها يُرسل الزوج الذي 
وصل من الاين الأيسر للأعلى › وبهذه الطريقة ينتج الجذر إما: 


)1,K( ٠1‏ حيث K‏ هو الدليل الأصغر لعناصر 5 المساوية ل" » أو 
2. (0,۸) مما يعني أنه لا يوجد آي عنصر مساو ل× ولذلك فإن قيمة ‏ لا معنى لها. 


مع هذه التعديلات فإن الجذر في المثال السابق ينتج (1,6). 
يمكن تتفيذ هذا التغيبر في قاعدة الاستعلام في ثلاث حالات: 
أ إا كان المطلوب هو الحصول على كل معلومات السجل كجوأب للاستعلام (أو ربما بعض 


حقوله) عندئذ إذ وأجد السجل الذي يتحقق فيه أن الحقل £ مساوي ل× ء فيمكن أن يأخذ ناتج الورقة 
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ثلاثية من الشكل (المعلومات لمطلوبة,|,1). أما بالسبة للجذر والعقد الوسطى فإنها تصرف 
ب- إذا كان المطلوب هو الحصول على جميع مواقع العناصر المسأوية ل × في 5 › في هذه 
الحالة عندما يتلقى الجذر أو العقدة الوسطى زوجين (,1) و (,1) فإن الزوجين يرسلا إلى الأعلى 
بشكل متتابع (تسلسلي ) وبهذه الطريقة تتتج أدلة جميع عناصر 5 المساوية ل × في الذهاية من 
الجذر. 

ت الحالة الثالثة هي جمع بين (أ) و(ب): فإذا كان المطلوب هو الحصول على جميع معلومات 
السجلات التي فيها الحقل 5 مماثل ل ×. وتعالج هذه الحالة عن طريق الجمع بين الحالتين السابقين. 


يجب الأخذ بعين الاعتبار في الحالات السابقة تزامن وجود عدة استعلامات على الخط. وهذا بسبب 
إرسال النتيجة للأعلى عن طريق كل عقدة وهي ليست أقل من خانة مفردة ولكن تقريباً عدة خانات من 
المعلومات ربما عدة سجلات (فغي أسوأً الأحوال تتألف الإجابة من ال ١‏ سجل المدخل) » ويما أن 
الإجابة على الاستعلام لا يمكن التنبؤ بطولها فإنه بالتأكيد لا يوجد أطول من أسوأً حالة للاستعلام الذي 
بأاخذ كلفة زمنية (۸ و٠|)©‏ وهذه المدة ثابتة وفي حالة ¶Q‏ استعلام نجد أنه ينفذ في زمن قدره 
.O(log n) + O(q)‏ 

2. خوارزمية العدد: 

قد نحتاج في بعض الأحيان إلى تغيير قاعدة الاستعلام فنسأل عن عدد السجلات التي يتساوى فيها 
الحقل 5 مع × . وتتم معالجة هذه الحالة تماما مثل الاستعلام الأساسي ما عدا أنه الآن نقوم بحساب 
مجموع إدخالات العقد الوسطى والجذر ( إضافة إلى العامل ٠٣‏ المنطقي). ومع هذا التعديل ينتج 
الجذر في المثال السابق العدد 2. 

3. خوارزمية أقرب عنصر: 


ربما يكون من المفيد أحياناً إيجاد العنصر من 5 بحيث تكون قيمته هي الأقرب ل × . تتم المعالجة 
هنا كما في الاستعلام الأساسي » حيث تكون × أول إرسال للأوراق » ومن ثم تحسب الورقة أ القيمة 
المطلقة ل ×-ر5 وتدعوها زه وتتتح (;1,0) كخرج. يتلقى الآن كل من العقد الوسطى والجذر زوجين 
(:0,) و (ز4,[): ومن ثم يرسل الزوج الذي يحوي الأصغر للأعلى. 


في المثال السابق مع هذا التعديل إذا كان الدحل 38=× فإن الجذر سينتج (3.2) كخرج ٠‏ تعالج حالة 
وجود زوجين يحويان المكون » نفسه إما باختيار أحدهما عشوائياً أو بإرسال الاثتين تسلسلياً. 
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+ # ا ف 
4. خوارزمية الرثبه: 
رتبة عنصر × في 5 تعرف كما يلي: هي (عدد العناصر الأصغر من × ) + 1 في 5. نعالج هذه 
الحالة كالتالي: نبدأً بإرسال × إلى الأوراق ومن ثم نجعل كل ورقة أ تتتج 1 إذا كان × > ر5 و0 فيما 
عدا ذلك. ۰ ۰ 
نحسب الآن رتبة × في 5 بجعل جميع العقد الوسطى تضيف إدخالاتها وترسل النتيجة للأعلى. 
يضيف الجذر واحد إلى مجموع إدخاليه قبل إنتاجه كرتبة. في المثال السابق يكون خرج الجذر مع هذا 
التعديل هو 3. ونلاحظ أن كل التعديلات السابقة تأخذ نفس زمن التنفيذ كما في الاستعلام الأساسي. 
4-3 تطبيقات الخوارزميات المتوازية: 


سنعرض الآن بعض تطبيقات مسائل القرار والأمثلية التي نستخدم فيها خوارزميات متوازية فعالة مثل 
خوارزمية حساب المجاميع البادئة لسلسلة وقد اخترنا مسألتين هما: 


مسألة الأعمال المتسلسلة وفق فترات انتهائها (sعم]ا sequencing with dead‏ 0bز)‏ وهي مسألة 
قرار و مسألة حقيبة الظهر (صء!طهإم kعةومة"))‏ وهي ممسألة حل أمثل. 


سناخذ في كل من المسألتين خوارزمية تعمل على حاسب متوازي باتصال شجري › علماً أن الخطوة 
الأساسية في كل من الخوارزميتين هي حساب المجاميع البادئة لسلسلةء وسنبداً أولاً بتوضيح عملية 
حساب المجاميع البادئة (وصنء ×ا؟ع١إم).‏ 


1-4-3 حساب المجاميع البادئة: 


لتكن لدينا سلسلة مولفة من ١‏ عدد [رم×,..ر2×رر×رو×)=× حيث 1<". ولتفرض أن ١‏ هو قوةل 2 
ویمکننا في غير هذه الحالة إضافة عناصر مساوية للصفر إلى السلسلة حتى يصبح حجمها قوةل 2 › 
ولنحسب جين المجاميع البادثة للسلسلة × ولتكن: {S0515.-9Sn-1}‏ =8 


.10,1,..,0-1 »من أجل:‎ 5s = x٣۳x۳ ٣..1X حيت:]‎ 


أما إذا كانت عناصر × تشكل سلسلة كالتالي: :م×..د×>م× =× عندها تكون ز5 هي مجموع العناصر 
المشكلة لبادئة بالطول 1. 
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يمكن حساب المجاميع ال ١‏ البادئة تسلسلياً في زمن (0)۸ بالإجراء التالي: 
1- خوارزميa‏ الإجرlء‏ : SEQUENTIAL SUM5S(X,S)‏ 
الخطوة 1: × سج ر8 


الخطوة 2: من أجل 1=1 إلى 1-1 نفد 


Si € Sj TF XK; 


Void SEQUENTIAL SUMS(X,S) 
{ 

stepl: So €— Xo; 

step2: for =1 ,i <n, FF) 


Si & Sji F Xi ; 


} 
ويعتبر زمن التتفيذ هذا أمثياً إذ أننا نحتاج إلى (2)۸) خطوة لقراءة الدخل. 


وعلى العكس عندما يتوفر عدة معالجات كل منها قادر على إنجاز عملية إضافة فإنه يمكننا الحصول 
على السلسلة [رمكر..,رك,م8=)5 بشكل أسرع. ونبين ذلك بالإجراء ۴PAR ALLEL -.SUMS‏ فیا 
يلي: 


PARALLEL SUM5S(%,S) : ءIرجڊإلا‎ aيمراوخ‎ -2 


الخطوة 1: من أجل 0=¡ إلى 1-" نفذ على التوازي 
5ı xi‏ 
الخطوة 2: من أجل 0-ز إلى (1-(1 عه1)) تفذ 
من أجل آ12 إلى 1-" نفذ على التوازي 


Sj € Sj FS; 


Void PARALLEL SUMS(X,S) 
stepl: for (î=Û , i <n , i++) in parallel 
Si Xi; 


step2: for j=0 ,j <logn, j++) 
for (=2 , i <n , i++) in parallel 
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si & sj + Sj; 
} 
يعتمد هذا الإجراء على المضاعفة التعاودية ويمكن لهذا الإجراء أن يطور على حاسب 8115 بذاكرة‎ 
معالج 1۔م,..,رطرمم وتأخذ‎ ١ الذي يحتاج إلى‎ ۸1180١8 مشتركة وذلك باستعمال الإجراء‎ 
عه0)1 من أجل كلفة‎ ١( المعالجات زم قيماً ابتدائية × وتعطي نتائح نهائية ;. ينفذ الإجراء في زمن‎ 
وتعتبر هذه الكلفة ليست أمثلية إذ أن مسألة حساب المجاميع البادئة تحتاج ()0 عملية‎ 0)١ 1٥ع‎ ”( 
تسلسلية بشكل كاف» وسنبين ذلك فيما يلي:‎ 


:Computing All Sums galجمأا حساب جميع‎ 2-4-3 


لنفترض أن لدينا عدد × من المعالجات كل معالج م يحجز في ذاكرته المحلية عدد زه + Nك[15.‏ 
والمطلوب حساب المجموع نة+..+رة+,4 من أجل كل معالج رم (المعروفة بالمجاميع البادئة عط 


„(prefix sums 


والسؤال هو: هل يمكن لنموذج الحاسبات 812 بذاكرة مشتركة المتوفر من أجل حساب جميع 
المجاميع من الشكل ;+..٣رة+ه؛ 1>¡>×N‏ استعمال N‏ معالج في زمن ×N(‏ ع0)10؟ 


هذا محتمل فعلاء فالفكرة هي جعل جميع المعالجات تعمل بآن واحد ما دامت هناك قدرة على استمرار 
عملية الإضافة. ويمكن أن تعطى خوارزمية الإجراء ۸11818 كالتالي: 


ځو ارزمية الإجراء :ALLSUMS(A1,32,..,4n)‏ 


من أجل 0=ز إلی ۸-1 چا تفذ 
من أجل 1=2+1 إلى N‏ نفذ على التوازي 


المعالج :P,‏ 
1- احصل على القيمة أره من المعالج أوم من خلال الذاكرة المشثركة 
ر أبدل رھ ب و٣‏ لزه 
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Void ALLSUMS(a,,82,..,aہ)‎ 
{ 
for j=0 , j <= log N-1 ,j++) 
for (i=2İ+1 ,i <=N , i++) 
processor Pj 


(i) obtains aj. from p; through shared memory , and 
(ii) replaces a; with a;2 +a; ; 


} 


نوضح عمل الإجراء 41808 في الشكل (4-3) من أجل 8= ونرمز ب ز4 إلى المجموع 
a Fagr.. ta;‏ 


في بداية الإجراء تبدل ;ج ب ;ه+..+رة+,ه في الذاكرة المحلية ل زم من أجل Nكآك1.‏ 


يتطلب الإجراء زمن (× عه0)1 وذلك لأن عدد المعالجات التي انتهت من حسابها يتضاعف في كل 
ر 


إن الإجراء ۸1.1808 يمكن أن يكون مكيفاً لحل أي مسألة حيث يمكن إبدال عملية الإضافة بأي 
عملية ثائية ترابطية أخرى مثلا: ضرب عددين » إيجاد أكبر أو أصغر العددينء وهكذا.. وهناك 
عمليات أخرى تطبق على زوج من الكميات المنطقية (أو أزواج من البتات) هي ×0١‏ ,إ0 , 14ة. 


P1 P2 P4 Ps 


P3 Ps6 Pr? Ps 
DSBS ESB BBE 


E E 
P! P2 p3 P4 Ps P6 P7 Ps 


الشكل (4-3 / أ) من أجل القيمة 1=ز 
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Pı P2 P3 Ps P5s Ps6 P? Ps 


الشكل (4-3 / ب) من أجل القيمة 2=ز 


Pı P2 P3 P4 Ps Pé P7 Ps 


ET 
Pı P2 P3 P4 Ps Ps P? Ps 
الشكل ( 4-3/ ج) من أجل القيمة 73ز‎ 
Ajj = aı+a2+.,+aز الشكل (4-3) يوضح عمل الإجراء ۸11808 من أجل 8= حیث‎ 


بدمج هذه الأشكال الثلاثة نحصل على شبكة خاصة صممت خصيصاً من أجل ثتفيذ الإجراء 
PARALLEL SUMS‏ على نموذج الحسابات 910 بذاكرة مشتركة. 
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شكل (5-3) شبكة تطوير خاصة للمضاعفة التعاودية 


نلاحظ من الشكل (5-3 ) أن هذه الشبكة الخاصة تحوي ١‏ عه1+1 سطر كل منها يحوي ١‏ معالج 
وبالتالي يكون عدد المعالجات في الشبکة ۸ چ٥[‏ ۸ + ۸. 


لنفترض أن المعالجات في كل سطر مرقمة من 0 إلى ١-1‏ وأن الأسطر مرقمة من 0 إلى ۸ عه]ا. 
يتلقى المعالج 1 في السطر 1٣ز‏ الدخل من: 

1“ المعالج 1 في السطر زء 

2- المعالج 1-2 في السطر ز إذا کان 2 < ¡ 

ويقوم كل معالج بحساب مجموع إدخاليه ويرسل النتيجة إلى السطر التالي من المعالجات المستعملة في 
الشبكة. يتلقى كل معالج دخلا واحدا فقط ويمرر ذلك الدخل إلى السطر التاليء وهكذا تدخل عناصر 
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السلسلة إلى الشبكة من نهاية واحدة (عتصر واحد لكل معالج) ويثلقى الخرج من النهاية الأخرى. 
وتحسب جميع المجاميع البادثة بزمن قدره (” عه0)1 ويعتبر هذا أفضل احتمال لزمن التنفيذ حيث أن 
الحد الأدنى هو ١(‏ عه!)2) وكلفة الشبكة (” ”عه! ")0 ومنه نجد أن هناك تموذج حسابات أضعف 
من نموذج الذاكرة المشتركة قادر على الوصول إلى زمن تتفيذ كهذا متل الإجراء 41.150613 الذي 
يستعمل عدداً أكير من المعالجات. 


3-4-3 خوارزمية المجاميع البادئة على شجرة: 


سنشرح الآن خوارزمية متوازية لحساب المجاميع البادئة تعمل على شجرة ثثنائية من المعالجات التي 
تعمل بشكل متزامن › ولتكن إدخالات الخوارزمية هي عناصر السلسلة إرو..,×رم× كل منها لواحد 
من المعالجات الأوراق ال١‏ من الشجرة الثنائية 1-م,..,:P,مص‏ » وعندما تنتهي الخورازمية فإن كل 
معالج :م ينتج 5 » وخلال الخوارزمية نتفذ المعالجات الأوراق والمعالجات الوسطى والمعالج الجذر 
عمليات بسيطة سنشرحها من أجل كل نوع من المعالجات: 


أولا خوارزمية المعالج الجذر: 

1- إذا وصل الإدخال من الولد الأيسر عندها أرسله على الولد الأيمن. 
2- إذا وصل الإدخال من الولد الأيمن احذفه. 

ثانيا خوارزمية المعالجات الوسطى: 


1“ إذا وصل الإدخال من الولد الأيسر والولد الأيمن عندها: 

: أرسل مجموع الإدخالين إلى الأب. 

أرسل الإدخال الأيسر إلى الولد الأيمن. 

2- إذا وصل الإدخال من الأب عندها : أرسله إلى الأولاد الأيمن والأيسر. 


ثالثا خوارزمية المعالجات الأوراق: 
2 ضع القيم :× في ;8. 


2“ أرسل قيمة ;× على الأب. 
3- إذا وصل الإدخال من الأب عندها أضفه إلى رو. 
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نلاحظ أن المعالجاث الوسطى والمعالج الجذر تكون متأهبة العمل عنلما تتلقى إلخال» وبشكل مشابه 
بعد الحصول على × وإرسال ك إلى الأب فإن المعالج الورقة يكون متاهباً أيضاً للعمل من خلال 
الإدخال الذي يتلقاه من والده. وبعد أن يتلقى المعالج الورقة الذي يقع في أقصى اليمين الإدخال رقم 
log f‏ فلن اليم SS 19..,Sn-1‏ نصح هي المجاميع البادئة لس ‘KOK1 n-1‏ 

مثال(3-3): 


سنشرح الآن خوارزمية المجاميع البادئة على شجرة من خلال تطبيقها على السلسلة إ1,2,3,4)=× 
وذلك كما في الشكل (6-3): 


Te e 


المرحنة 1/ 


0 


الشكل (6-3) حساب المجاميع البادئة على شجرة المعالجات 
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4-4-3 تحليل خوارزمية المجاميع البادئة على شجرة: 


إن عدد الخطوات المطلوبة من الخوارزمية هو البعد بين المعالج الورقة في أقصى اليمين والمعالج 
الورقة في أقصى اليسار ء وهذأً البعد هو (" عه! 2) ولذلك فإن: (” عه0)1 = (م)† » ويما أن: 
2-1 = (ہ)۴ فإن: ( ع10 0)۸ = (م)C‏ وهذه الكلفة ليست أمثية. 


ويمكننا الحصول على خوارزمية لها كلفة أمثلية بسهولة وذلك من خلال زيادة فعالية المعالجات 
الأوراق أي زيادة المهام التي تتفذها. لتكن لدينا شجرة المعالجات ب ل ورقة ولتكن ر ,..و۳0,۲1 
حيث ١ < N‏ وسنفترض للسهولة أن "١‏ هو مضاعف للعدد × مع العلم أن الخوارزمية يمكن أن تتكيف 
للعمل مع جميع قيم .٨‏ 


لنأخذ سلسلة الدخل [رم×,..,×رم×) = × في البداية يحتوي المعالج الورقة رم على العناصرالتالية: 
Xi(rN) s XIN} s «° s KiNHONY1‏ . بالنسبة للمعالج الجذر والمعالجات الوسطى تنفذ الأعمال نفسها 
التي تم شرحها مسبقاً وسنناقش الآن عمل المعالجات الأوراق التي تنفذ الخطوات المعطاة في الإجراء 
التالي. سنرمز فيما يلي ب ز۷ إلى عدد يتألف من خانة واحدة في التمثيل الثنائي للعدد 1 أي أن: 


v= 0 
Vj 7 1 + Vi mod ر‎ 
m = p/N : حیث‎ 
خوارزمية المعالج الورقة:‎ -1 


1- احسب جميع المجاميع البادئة ل X41‏ , ۰-۰ و Xim > Ximı1‏ ¢ 
وخزن النتائج في 1 +با؟ و ۰۰۰ و 1+صاگص5 ۰ 
وأرسل 1-« +5 إلى المعالج الأب. 
2- ضع المجموع المرحلي (المؤقت) ۲ صفرا. 
3- إذا كان الدخل قد وصل من الأب عندها أضفه إلى ۲ . 
4- ذا کان ۲ هو مجموع إ۷ دخل متلقى من الأب تماما عندها أضف إ۲ إلى كل من التالي: 
Sim > Sim+l s <», Simtm-1‏ 
لكي نفهم شرط الانتهاء في المرحلة (4) نلاحظ أن ز۷ هي عدد جذور الأشجار الفرعية على يسار م 
تماما وهي التي ترسل الإدخال إلى :م . 
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2- تحليل خوارزمية المعالج الورقة: 


يعتمد عدد البيانات المطلوية من الخوارزمية للتجوال أعلى وأسفل الشجرة على عدد العناصر المخزنة 
في كل معالج ورقة. مما يؤدي إلى أن زمن تتفيذ الخوارزمية هو مجموع ما يلي: 


1- الزمن المطلوب من الورقة رم لحساب 1مبمز؟ , ٠.٠‏ , ا+سن؟ , م8 » ومن ثم إرسال S1‏ 
إلى الأب (أي أن الزمن هو )0),/١(‏ طالما أن جميع الأوراق تتفذ هذه الخطوة بآن واحد. 

2- الزمن المطلوب من الورقة التي في أقصى اليمين رص لتلقي إدخالها النهائي (أي إلى زمن 
.(O(log N)‏ 

3- الزمن المطلوب من الورقة في أقصى اليمين .»م (وهو آخر معالج يتوقف) لإضافة .بج إلى 
كل المجاميع التي يحتويها (أي أن الزمن هو .)0)0/١(‏ 


t(nJ= O(P/N) + O(log N) : aig 


ويما أن : 2×N-1‏ = (ص)م و N(‏ ع0ا N‏ + ")0 = (م)ء فهذا يعني أن الخوارزمية يكون لها كلفة 
أمثية إذا كان (م)0 = × عه! N×.وعلى‏ سبيل المثال إن (۸ عهN=0)/1‏ ستتجح بالوصول إلى كلفة 
أمظية. 


يجب أن نلاحظ أن أمثظية كلفة الخوارزمية تعود أصلا إلى حقيقة أن الزمن المطلوب في الحسابات 
داخل الأوراق يتحكم في الزمن المطلوب من المعالجات للاتصال فيما بينها. وهذا قد أوصلنا إلى 
تجزئة مسألة المجاميع البأدئة إلى مسائل جزئية مجزأة وهذا يتطلب كمية صغيرة من الاتصالات فقط. 
5-4-3 المجاميع البادئة على الشبكة طءءM:‏ 

نبين فيما يلي كيفية حساب المجاميع البادئة لسلسلة على مصفوفة معالجات متصلة شبكيا. تعود رغبتنا 
في دراسة الخوارزمية المتوازية لحل المسألة على هذا النموذج لسببين: 

عندما يكون الزمن المأخوذ من تجوال وحيد على طول السلك متتاسبا مع طول ذلك السلك تكون 
الشبكة هي الأفضل من الشجرة لحل عدد من المسائل وهذه المسائل تتصف بان زمن حلولها تتناسب 
مع المسأفة: 1- من الجذر إلى الورقة في الشجرة 

2- من السطر العلوي إلى السطر السفلي في الشبكة. 


وتعتبر مسألة حساب المجاميع البادئة لسلسلة مدخلة هي واحدة من هذه المسائل. 
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كما أنه يمكن لشبكة ب 1 معالج أن تخزن سلسلة ب ١‏ إدخال بشكل أسرع من شجرة ب" ورفة 
بغض النظر عن أية افثراضات قمنا بها حول زمن النشر الوحيد على طول الأسلاك. وطالما أن 
الترتيب عنصر هام في حلنا للمسائل الموصوفة سنفرض لسهولة التعريف فيما يلي أن 1" هو مربع 
كامل ولتكن "1 = " . يمكن حساب المجاميع البادئة ل ري .»)=× على حاسب باتصال 
شبكي × كما يلي: ولتكن المعالجات هي 1.مP,..,ر۳‏ ,مص مرتبة سطرياً بترتيب أعظمي. في البداية 
تحتوي :م على × وعندما تنتهي الخوارزمية يحتوي زم على ر5. 


تتالف آلخوارزمية من ثلاث خطوات: 


في الخطوة الأولى: يتم العمل في جميع الأسطر على التوازي حيث تحسب المجاميع البادئة للعناصر 
في کل سطر بشکل تسلسلي: فیضیف کل معالج على محتویاته محتوی جاره الأيسر. 


في الخطوة الثانية: تحسب المجاميع البادئة للمحتويات في العمود اليميني. أخيراً مرة أخرى تتم جميع 
عمليات الأسطر على الثوازي حيث تضاف محتويات المعالج اليميني في السطر K-1‏ إلى جميع 
المعالجات في السطر kK‏ (ما عدا اليميني). 


تعطى الخوارزمية فيما يلي کإجراء 81۷8 ×۴۴1 ۶۸ 16S8‏ نرمز فيه إلى محتويات المعالج في 
السطر K‏ والعمود ب زلا حيث: js m-1‏ <0 و .OSsk<m-l‏ 


:MESH PREFIX SUMS(,S) ءIرجإلا خوارزمية‎ 


الخطوة 1: من أجل 0= إلى 1-” نفذ على التوازي 
من أجل 1=ز إلى 1-ص نفذ 
Uj Ukj-1‏ ج“ Ukj‏ 
الخطوة 2: من أجل 1= إلى 0-1" نفذ 
Ukm-1 € Uk,m-t FT Uk-1,m-1‏ 
الخطوة 3: من أجل 1= إلى 1-« نفذ على التوازي 
من أجل 2-ط=ز إلى 0 نفذ 
Uj €” Uj + Uk-1,m-1‏ 


Void MESH PREFIX SUMS(X,S) 


{ 
step: for (k=Û0 , k < m , k++) in parallel 
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for (j=1 ,j <m, j++) 
Uj € Uj F Uxj-15 
step2: for (k=l1 ,k<m, k++) 
Ukmr-1 €7 Ukgmrl F Uk-1,m-1 $ 
step3: for (k=1 , k < m , k++) in parallel 


for (j=m-2 , j2=0 , (--ز‎ 
Uj €” Uj F Uk-1,m-1 


نلاحظ أنه في الخطوة 3 ...»نا قد انتشر على طول السطر ‏ من المعالج في العمود 1-" إلى 
المعالج في العمود 0 كل معالج يضيفه إلى محتواه ويمرره على جاره الأيسر. 
6-43 تحليل خوارزمية المجاميع البادئة على الشبكة: 


لن کل خطوة تتطلب زمناً ()0 ولذلك فإن ()0-(0)) » وبما أن عدد المعالجات ”=(ہ)م فإن 
الكلفة: (7م)0 ع(م)ء وهي ليست أمثية. 


مثال(4-3 ): | 


لتكن 0=16 سنوضح عمل الإجراء MESH PREFIX SÜMS‏ فيما يلي في الشكل التالي وفق 
جداول نرمز فيها لشبكة المعالجات وهي تحوي القيم : ز× ٣...۳‏ 1× + × = ز۸ 


مبدئياً تحتوي المعالجات على القيم المبينة في الجدول () 
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A02 A03 


X4 45ھ‎ A46 


تغير القيم بعد الخطوة 1 تبين في الجدول (ب) 
ja ar er‏ 


تغير القيم بعد الخطوة 2 تبين في الجدول (ج) 


Xo Aoı 


0 
2 


تغير القيم بعد الخطوة 3 تبين في الجدول (د) 


الشكنل (7-3) يوطضسح حساب المجاميم البادئة باستعماJ‏ الإڄر |< MESH PREFIX SUMS‏ 


لنفترض الآن أن لدينا شبكة من المعالجات N” × N"‏ حيث ۸> . لحساب المجاميع البادئة 
للسلسلة [إم×ر..×رم»)=× يتلقى كل معالج ./١‏ عنصر من × مبدئياً ويحسب مجاميعها البادئة. 
يمكن أن نعدل الإجراء سبق MESH PREFIX SÜMS‏ مثل خوارزمية الشجرة ولذلك عندما 
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ينتهي الإجراء نجد أن كل معالح يحتوي على آ۸/م من المجاميع البادئة من × . يأَحذ الإجراء المعدل 
زمناً (0)۸ + (×/م)0 وكلفة (7م)0 + (١/م)0‏ » ونلاحظ أن هذه الكلفة ليست أمثية عندما 
يكون: (7م)0 = .×N‏ 


7-4-3 مسألة الأعمال المتسلسلة وفق فترات انتهائها : 


ليكن لدينا مجموعة من الأعمال التي نريد تنفيذها على آلة واحدة وليكن عددها ١‏ ولنرمز لها كما يلي: 
.و هز) = [ . يمكن للالة أن تتفذ عملا واحدا في زمن ما وعندما تحدد عملا فيجب عليها أن 
تكمله قبل أن تبداً بمعالجة العمل التالي. 


يرتبط بکل عمل رزما يلي: 


1“ زمن معالجة با . 
2- مدة انتهاء زل يجب أن يكتمل العمل من خلاها. 


نعرف جدول الأعمال بأنه تبديل الأعمال في [ الذي يحدد ترتيب تتفيذهاء ويقال عن الجدول أنه 
مناسب أو عملي إذا كان كل عمل ينتهي بمدة انتهائه . 


والمطلوب أنه إذا كان لدينا ١‏ عمل (بمل..رزيمز) لها أزمنة المعالجة [مار.ءءأرها) ولها فترات 
الانتهاء {do,dı,..,dn-1}‏ فيل يوجد جدول عملي لهذه الأعمال 


يمكن الإجابة عن هذا السؤال بالإيجاب إذا وفقط إذا كان أي جدول أعمال تتفذ فيه الأعمال بترتيب 
متزايد لفترات الانتهاء عملياً. لذلك يكفي لحل المسألة إيجاد جدول أعمال ترتب فيه الأعمال بترتيب 
متزايد لفترات الائتهاء وفحص فيما إذا كان هذا الجدول عملياً أم لا وفي حال تم ذلك فإن الإجابة عن 
السؤال تكون نعم و إلا فالإجابة لاء 

تحتاج هذه الخوارزمية لكلفة زمنية (” عه1 0)۸ لترتيب الأعمال بشكل تسلسلي ومن ثم إلى كلفة 
زمنية («)0 لاختبار فيما إذا كان كل عمل يمكن أن يتم في فترة انتهائه. 

سنوجد الآن خوارزمية متوازية تعمل على حاسب باتصال شجري ولتكن المعالجات الأوراق هي 
١-م۳..و1‏ ,0 وسنفترض من أجل السهولة أن الأعمال مرتبة بترتيب متزايد لفترات الانتهاء أي أن: 


اول ک. .. > ل ك مل . وليكن المعالج :م يحتوي مبدئياً على إا و » تعطى الخوارزمية كإجراء 
.TREE SEQUENCING‏ 
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‘TREE SEQUENCING (J,419¥¢7) ءIرڊإا خوارزەي‎ “1 


الخطوة 1: احسب المجأميع البأادئة _م5,..ور8رم؟ ل 1-مأرءو أرما 

الخطوة 2: 

1= المعالج الورقة :م: إذا كان رل ك ر5 عندئذ أرسل "نعم" للأب وإلا فأارسل "لا" للأب. 

2~ المعالج الوسطي: إذا كان الدخل من كلا الولدين هو "نعم" عندئذ أرسل نعم للأب و إلا 
فارسل "لا" للأب. 

3- المعالح الجذر؛ إذا كان الدخل من كلا الولدين هو انعم" عندئذ ضع في إعسكصه 'يوجد 
جدول أعمال و إلا فضع في إع«كصه "لا يوجد جدول أعمال عملي". 


Void TREE SEQUENCING(J,answer) 
{ 


stepl: compute $o,S1.-,8,.1 , the prefix sums Of toy1,-«,n-1 
step2: (1) leaf processor Pp; 
if (sj <= d; ) 
send " yes " to parent ; 
else 
send " no " to parent ; 
(iD intermediate processor 
if (inputs from both children are " yes ") 
send " yes " to parent ; 
else 
send " no " to parent ; 
(ti) root processor 
if (inputs from both children are " yes ") 
answer 4- " feasible schedule exists" ; 
else 
answer «- " no feasible schedule "; 


مثال(5-3 ): 
لتکن 1۳4 حیث [1,2,3,4) = [ ما ررارما) و [3,5,7,9) = [بمل,..ولروك). لذلك فإن: 
{SoS} = {1,4,7117‏ . 


لدینا : رل & روو ر 5 رو بل & دو رل < ر5 وبالثالي لا يوجد جدول أعمال عملي لهذه المسألة. 
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2- نحليل خوارزمية الإجراءٍ ‘TREE SEQUENCING‏ 


تتطلب كلا من الخطوتين 1 و 2 : ( ۸ عه1 )0 عملية. ومنه نجد أنه يتم التحكم بزمن تتفيذ 
الخوارزمية من خلال الزمن المطلوب للترتيب المبدئي للأعمال في المعالجات الأوراق وفق الترتيب 
المتزايد لفثرأت الانتهاء وهو .2(n)‏ 


:THE KNAPSACK PROBLEM مسأل حقيب لظۈظر‎ 8-4-3 
[MLFi,1981], [WShi,1979] , [DFGP,1982j 


في هذه المسألة نتميز حقيبة الظهر بأنها تستطيع حمل وزن أعظمي ۷ ومجموعة من ١‏ مادة ولتكن: 
.4,4 )=۸ والتي أوزانها على التوالي: .م ۷,.., ,م ) كما يرتبط بكل مادة فائدة ونرمز 
لمجموعة الفوائد ب: إرمم,..ورط,مط)؛ إذا وضعنا في حقيبة الظهر الجزء ;< من المادة التي وزنها 
;۷ حيٹ 1 > ;2 > 0 عندئذ فإن الفائدة المكتسبة هي ;2 . والمطلوب في هذه المسألة هو تعبئة حقيبة 
الظهر بالمواد أو بأجزاء منها بحيث: 


1- الوزن الئاتج للمواد المحددة لا يتجاوز ۷ 
2- الفائدة المكتسبة الناتجة أكبر ما يمكن. 


لديذا 2n]‏ عاد موجب معطی: WoW 19--9Wn-1, W, Po:P15۰-Pn-1‏ وهي ضرورية ص أجل زيادة 
الكمبة: 


n-l 
Q = 2z; Xx Pi 


وهي تخط للشرطين الثال ٠‏ 
1. ايأ كان 1 فإن: 1> ;2> 0 


n=l 
2, Z; x Wi S5 W 2 
i=0 


إن الحل الأمثل هو سلسلة [بم2,..,2,م2] = 7 يرفع Q‏ للحد الأعلى ويستوفي الشروط 1و2 ويمكن 
أن تنحصل على مثل هذا الحل إذا كانت المواد المخثبرة مرتبة بشكل متزايد للنسب ,سم . إذا كانت 
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المادة التي نختبرها توافق الجزء المتبقي من حقيبة الظهر عندئذ نأخذ المادة و إلا نأخذ جزء منها فقط 
ونضعه في حقيبة الظهر. يتطلب هذا العمل تسلسلياً كلفة زمنية قدرها (۸ عه 0)١‏ لثرتيب الفوائد 
والأوزان ومن ثم كلفة زمنية («)0 لفحص جميع المواد واحدة في كل مرة. 


سنأخذ الآن خوارزمية متوازية لإيجاد السلسلة الأمظية [1م202,..,2) تعمل على حاسب متوازي 
متصل شجرياً يحتوي على المعالجات الأوراق 0:۳1٠.‏ . 

وسنفترض من أجل سهولة ترميز العبارات الأصلية في المسألة أن المواد مرتبة بشكل متتاقص لنسب 
الفوائد إلى الأوزان أي أن: .ممع < ... < P:/۷١‏ < ۷مم » يحتوي المعالج الورقة ;۴ في البداية 
على زW‏ و زط و۷ . تعطى الخوارزمية فيما يلي جر اء TREE KNAPSACK‏ 


:TREE KNAPSACK الإجراء‎ يمnjراوخ‎ “1 


الخطوة [: 

1- احسب احسب المجاميع البأدئة ر_م8,.. وم8 ل ۷۷-1 .۷1ر۷ 
2- من أجل 1=1 إلى ۸-1 نفذ على التوازي: كل معالج ;۴ يحسب .5ء . 
الخطوة 2: 

من أجل 10 إلى 1-1 نفذ على التوازي : 


ذا کان ¥ > ر5 عندئذ: ضع [- Zz‏ 
و إلا إا كان W(‏ < رئ) و W(‏ > ر۔ز) عندئذ: /w;‏ ;¥۷5 ):2 


و إ¥: 7-0 


Void TREE KNAPSACK(A,W,Z) 
{ 


Step1: (1.1) compute So,S1,..,8,-1 , the prefix SUMS Of Wo;W .و1‎ Wn-1 
(1.2) for (i=1 , i < n , i3) in parallel 
P; computes Si-1 ; 
Step2: for û=Û , i <n, it) in parallel 
if (s5 W ) 
2-i; 
else if ((Sı ج‎ N4 && (Si-1 = W)) 
zıt—(W-Si Wi ; 
else 
7 س4‎ 0; 
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نلاحظ أنه يمكن حساب الجزء الناتج في الجذر كما يلي: 


1“ كل معالج ورقة ۴ يحسب الجزء (ة) وهو :ص × < ويرسل الجزء (أ) إلى والده. 
2- كل معالج وسطي يجمع إدخاليه الوأاصلين من ولديه ويرسل النتيجة إلى والده. 
3“ المعالج الجذر يجمع إدخاليه اللذين تلقاهما من ولديه وهذا هو .Q‏ 


مثال(6-3 ): 


لتکن 4 = n‏ و 5,9,24{ = {PosP1s.Pa1} = {100,135,26,20} gs {wWoywıs..Wa1}‏ 
و W=15‏ . ومنه نجد أن: [15,14,16,20) = [1۔م؟,..,81,م5) وبما أن : ¥ > مو W‏ > ۶ء فإِن: 
Z27 Z21‏ وأيضا: W‏ < رو لذلك: 0.5 = 15-14(/2) = رz‏ وأخثراً : W‏ < وء لذلك: 0 = وے. 


2- تحليل خوارزمية حقيبة الظهر: 


تحتاج الخطوتان 1 و 2 : (” عه0)1 و (0)1 خطوة على التوالي. كما يتحكم بزمن تتفيذ هذه 
الخوارزمية الزمن المأخوذ مبدئيا من أجل ترتيب الأجزاء والأوزان والأوراق بشكل تتاقص نسبها 
وهذا الزمن هو (2)1). 


3“ حلول مسألة حقيبة الظهر على الشبكة: 

رأينا أن الحلول الشجرية تحتاج على الأقل زمناً ()2) وذلك إذا لم تكن السلسلة المدخلة مرتبة أصلا. 
وسنبين الآن كيف أنه في هذه الحالات يكون الحاسب المتوازي باتصال شبكي نموذجاً أكثر فعالية لحل 
مسائل الأمثلية والقرار هذه. 

لنفترض أن الدخل في مسائل حقيبة الظهر والأعمال المتسلسلة ليس مرتباً كما هو مطلوب في الإجراء 
TREE KNAPSACK‏ و "PREESEQUENCING‏ على التوالي. 

إذا كان لدينا حاسب شبكي ”م × م عندئذ: 


1“ يمكن أن ترتب سلسلة الدخل ب ١‏ عنصر على الشبكة بزمن ("0)۸ 
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2- يمكن أن يعمل كل من الإجراعين السابقين بسهولة على الشبكة بزمن (”0)۸ 


وهذا يعني أن الزمن الكلي المطلوب للتنفيذ لكل من مسألتي الأعمال المتسلسلة وحقيبة الظهر هو: 
".)0 = («) وهذا أسرع من الزمن المطلوب باستعمال الخوارزميات الشجرية. 


بما أن " = (م)م عندئذ نجد: («)0 = (م) وهذه الكلفة ليست أمثلية من وجهة نظر زمن التتفيذ 
( عه! 0)١‏ الكافي لحل المسألتين تسلسلياً. 


لنفترض الآن أن لدينا شبكة N × N"‏ حيث: عه[ > × ونعلم أن شبكة بهذا العدد من المعالجات 
يمكن أن ترتب سلسلة ب ١‏ عنصر بكلفة أمظية (» عه! )0. وبما أن م > وها من أجل م 
كبير كفاية فإن المجاميع البادئة لسلسلة ب ١‏ عنصر يمكن آن تحسب على شبكة N × N"‏ بكلفة 
أمثظية ()0. هاتان العمليتان المسميتان الترتيب وحساب المجاميع البادئة تتحكمان في حل مسألتي 
الأعمال المتسلسلة و حقيبة الظهرء وهذا يعني أنه يمكن حل المسألتين بشكل أمثلي على شبكة من 
المعالجات. 


5-3 خوارزميات متوازية لأجهزة متعددة المعالجات ذات ذاكرة مشتركة: 


سنقوم فيما يلي بعرض بعض المسائل الشهيرة رياضياً » ونضمن التعاريف الخاصة بهاء ونضع 
خوارزميات الحلول التسلسلية والمتوازية لها » ونميز بين الخوارزميات المتوازية من أجل النماذج 
المختلفة للحواسيب وطرائق اتصالها في بعض منها › كما نضع الشروط المناسبة لحلها والخواص 
الهامة التي يجب أن تحققها » ومن ثم نعرض تحليلاً لكل منها لدراسة أمثليتها وكلفتها الزمنية وغيرها 
مع ذكر بعض الأمثلة التوضيحية التي تساعد على فهم المسألة. كما تذكر الخواص والأهداف التي 
نحاول الوصول إليها في كل خوارزمية. 


في البداية سنأخذ مسألتين من مسائل المقارنة مسألة الاختيار في سلسلة التي ظهرت في العديد من 
تطبيقات علوم الحاسبات والإحصاء ونحاول إيجاد خوارزمية متوازية لحل هذه المسألة تحقق عدداً من 
الأهداف والخواص الضروريةء ومن ثم نأخذ مسألة أخرى تعرف بمسألة الدمج (لدمج متسلسلتين من 
البيانات لتشكيل متسلسلة ثالثة جديدة) وهي أحد مسائل المقارئة فقد ازداد الدمج في علم الحاسبات مع 
تنوع المحتويات متضمناً قواعد البيانات بشكل خاص وترتيب الملفات عموماً إذ أن العديد من هذه 
التطبيقات تستعمل مسألة الدمج للبيانات الرقمية ومن الضروري توظيف الدمج بشكل تام بحيث يحذف 
التكرار في الإدخالات من المتسلسلة الناتجة. 
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1-5-3 مسألة الاختيار: 
تحتوي دراستتا عن تحليل وتصميم الخوارزميات على المسألة التالية: 


لنأخذ سلسلة 8 من 1 عنصر وعدد صحيح K‏ حيث ">>1 والمطلوب تحديد العنصر K‏ الأصغر في 
S‏ /إتعرف هذه المسألة بمسألة الاختيار |/. 


لقد ظهرت هذه المسألة في العديد من التطبيقات في علوم الحاسبات والإحصاء. وغرضنا هنا هو إيجاد 
الخوارزمية المتوازية لحل هذه المسألة على حواسيب من النموذج 91M‏ بذاكرة مشتركة. وسنصمم 
الخوارزمية بحيث تلائم عدداً من الأهداف ومن ثم نحللها لنتحقق من أن تلك الأهداف ملائمة فعلا. 


تنتمي هذه المسألة إلى مجموعة مسائل تدعى مسائل المقارنة /كمء1طهآم s0۸اcompar/‏ حيث تحل 
هذه المسائل عادة عن طريق مقارنة أزواج من العناصر قي سلسلة مدخلة. 


بداية لنأخذ التعاريف التالية: 
1-الترتيب الخطي :Linear Order‏ 
نقول عن عناصر مجموعة ۸ أنها تشكل ترئيباً خطياً إذا وفقط إذا كان: 


1. من أجل أي عنصرين ۾ وط من ۸ فإن: ۾ سبق ط ء أو 4 ينطبق على ط » أو ا يسبق 4. 
2. من أجل أية ثلاثة عناصر ج و ا و ع فإنه إذا كان ۾ يسبق ط وط يسبق ء فإن 4 يسبق ›. 


وكمثال نجد أن مجموعة جميع الأعداد الصحيحة تشكل ترتيباً خطياء مثال آخر مجموعة الحروف في 
الأبجدية اللاتيثية. فهذه المجموعات هي تراتيب خطية. 


2-الرتبة (الدرجة) kروR:‏ 


إذا كان لدينا متتالية [م,..,ركرر8=)5 عناصرها تنتمي إلى مجموعة تشكل ترتيبا خطيأً. تعرف رتبة 
العنصر ;5 من $ بأنها تساوي: ((عدد العناصر في 8 التي تسبق :5 )+ 1). 


ومنه: من أجل [5,6,0-,3,2-,8=)8 رنبة 0 هي 3. 


ملاحظة: إذا کان ر = 5 فإن رز يسبق ر إذا وفقط إذا كان ز> 1 . 
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:Selecti0n 3-الاختيار‎ 


إذا كان لدينا منتالية إبك,..ررك,8=)5 عناصرها تنتمي إلى مجموعة تشكل ترتيباً خطياً ولنأخذ ) عدد 
صحيح حيث K > ١‏ > [1. والمطلوب تحديد العنصر الذي رتبته تساوي >. 


مرة أخرى في المجموعة : [5,6,0-,3,2-,8)=$ العنصر من الرتبة 4 هو 2. 


الصحيحة كما في المثال السابق » وعندها فإن الاختيار يكون من أجل إيجاد العنصر الأصغر ). 


لنأخذ مجموعة الرموز التالية: 

من أجل عدد حقيقي ۲ فإن: 

(the ceiling of) r "ترمز إلى أصغر عدد صحيح أكبر من ۲ أو يساوي‎ ٣٣ 
(the floor of 1) ۲! د ا ترمز إلى أكبر عدد صحيح أصغر من ۲ أو يساوي‎ 


لذلك فإن: 3= 3.01 = 13.0 , 3=ر 13.9 ,3.1'=4' 
4-asîllقıد :Compl}exity‏ 


هناك ثلاث قيم خاصة في مسألة الاختيار يمكن تمييزها بسهولة وهي: k=" , K=١/2‏ , 1=). نستطيع 
في الحالتين الأولى والثانية أن نبحث عن العناصر الأصغر والأكبر في 8 على التوالي. أما في الحالة 
الثالثة ستكون رمء في وسط 5 وبالتالي فإن نصف العناصر أصغر منه (أو مساوية له) والنصف 
الآخر أكبر منه (أو مساوية له). ومن الواضح على الأقل في نموذج الحسابات التسلسلي أن الحالتين 
الأولى والثائية أسهل في الحل من الحالة k="/2‏ أو أي قيمة أخرى. فمن أجل k=‏ ,1= نقوم 
بفحص العنصر التالي باستخدام عنصر ما نحفظ فيه العنصر الأصغر (أو الأكبر) الذي نجده حثى 


أُما من أجل الحالة (” > > 1) فإنه لا يوجد حلول واضحة كالحالتين الباقيتين. ومن الواضح أنه إذ 
كانت $ مرتبة حيث: إرم؟,..رم5ررى8=)5 فإن مسألة الاختيار تصبح سهلة وعادية » وعتدها 
نستطيع الحصول على رم في خطوة واحدة. طبعأ لا تفثرض أن الحالة كذلك ولكنتا نرغب بترتيب $ 
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فقط من أجل حالة واحدة خاصة وذلك من أجل قيم كبيرة ل .١‏ 


وبغض النظر عن قيمة ‏ نجد أنه عند تحديد العنصر الأصغر ‏ يجب علينا أن نفحص كل عنصر في 
8 على الأقل مرة واحدة. وهذا يقودنا إلى الحد الأدنى لعدد الخطوات التسلسلية المطلوبة لحل المسألة 
وهو (م)2) أي أن الحد الأدنى للكلفة لأي خوارزمية متوازية للاختيار هو (2)۸) . 


1-1-5-3 الخوارزمية التسلسلية لمسألة الاختيار : 


هناك سببين لاهتمامنا بالخوارزمية التسلسلية الأول هو أن الخوارزمية المتوازية تؤىس على 
الخوارزمية التسلسلية كما أنها تعتبر التنفيذ المتوازي للخوارزمية التسلسلية على حواسیب ٤۸٤۷‏ 
SM 9‏ والثاني آن الخوارزمية المتوازية تفترض وجود الخوارزمية التسلسلية وتستعملها 
کاخراه: 


فيما يلي نعرض الخوارزمية وهي على شكل إجراء تسلسلي EQ U ENT1AL SELECT‏ یتعاود 
طا وهي تستعمل طريقة فرق تسد (1ء٤2١٠إممة‏ إn¶ueتء‏ إصه i1ideل)‏ لتصميم الخوارزمية. 


الإدخالات البدائية للإجراء هي المتسلسلة 8 والعدد الصحيح ‏ . في كل مرحلة من التعاودية يطرح 
عدد من عناصر $ جانباً من الاهتمام لبدء تحديد العنصر الأصغر K‏ وهذا يستمر حتى يحدد العنصر 
) في النهاية. 


نرمز ب 18 لندل على حجم المتسلسلة 8 وهكذا نجد مبدثياً: ۸ = 8|. وليكن © ثابت صحيح صغير 
يحدد لاحقا عند تحليل زمن تنفيذ الخوارزمية. 


1“ خوارزمية الإڄجر|ء SEQUENTIAL SELECT (S, K)‏ 
فطوة 1: - إذا كان ©>|8| عندها رتب $ وأعد العنصر K‏ مباشرة 

- وإلا قسم 8 إلى |8|/Q‏ متسلسلة جزئية كل منها يحوي © عنصر على الأكثر. 
الخطوة 2: - رتب كل من المتسلسلات الجزئية وحدد العنصر الأوسط في كل منها. 


الخطوة ٠:3‏ - استدعي الإجراء SEQUENTIAL SELECT‏ تعاودیاً لإیجاد ٣‏ العنصر الأوسط 
من المتوسطات في المجموعات |5|/Q‏ (التي أوجدت في الخطوة2). 
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- أنشئ ثلاث متسلسلات جزئية ,8 و ر8 و ر8 من العناصر الأصغر من ۳ 
والمساوية ل " والأكبر من " على التوالي. 


- إذا كان ۸ 2 |8| عندها إيجب أن يوجد العنصر في [S1‏ استدعي الإجراء 
EQUENT1AL SELECT‏ تعاودياً لإيجاد العنصر الأصغر K‏ في ,8 . 


- وإلا إذا کان ۸ = |8| عندها أعد "۳ . 


- وإلا استدعي الإجراء SEQUENTIAL SELECT‏ تعاودیاً لإیجاد العنصر 


الأصغر (ار8| - |8| - ۸) في 8 . 


Void SEQUENTTAL SELECT (S, £) 


if (|S|<Q ) sort S and return the Ath element directly ; 


else subdivide S into |S/Q subsequences of Q elements each (with 
up to Q-1 leftover elements) ; 


sort each subsequence and determine its median ; 


call SEQUENTIAL SELECT recursively to find m , the median of 
the |S/Q medians found in step2 ; 


creat three subsequences S! „, S2, and S; of elements of S smaller 
than, equal to, and larger than m, respectively ; 


if {S| 2 K) /* the kth element of S must be in S, */ 


call SEQUENTIAL SELECT recursively to find the Ath 
element of S, 


else if (S,|*|Sa| = K) 
return IM ; 


else call SEQUENTIAL SELECT recursively to find the {K 
- |S,| = {S»]Jth element of $; ; 
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نلاحظ أن العبارة السابقة للإجراء SEQ UENT1AL SEL ECT۲‏ التي لا تحدد العئصر الأصغر ) 
في $ تتعاود في الواقع۔ ويمكن تطبيق ذلك بطريقة وحيدة وهي أن ذأخذ وسيط إضافي في راس 
الإجراء وليكن × بالإضافة إلى $ و K‏ فنعيد قيمة العنصر الأصغر ‏ في ×. وهناك طريقة أخرى 
أبسط وهي إعادة العنصر الأصغر ) كأول عنصر في المتسلسلة S؟.‏ 


2- تحليل خوارزمية الإڊرlء SEQUENTIAL SELECT‏ 
سنعرض الآن تحليل زمن نتفيذ الخوارزمية t)۸( :SEQUEN 11۸1 SE ٤٣ ٣‏ خطوۃ بخطوة. 


الخطوة 1: طالما أن © ثابت رتب $ عندما |8|>Q‏ وهذا يأخذ زمنا ثابتاً و إلا يتطلب تقسيم $ إلى 


زمن قدره ٩۸‏ من أجل ثابت ما .٥‏ 


الخطوة 2: طالما أن كل من المتسلسلات |5[/Q‏ من العناصر Q‏ ثابتة فإنه يمكن ترتيبها بزمن ثابت 
لذلك فإن الزمن الذي نحتاجه من أجل هذه الخطوة هو ١ء‏ من أجل ثابت ما ر. 


الخطوة 3: لدينا متوسطات عددها |5|/Q‏ إذا الزمن الذي تأخذه التعاودية هو (1)1/0. 


الخطوة 4: يوجد طريقة واحدة لإيجاد ص خلال إنشاء 8 ل و82,8,ر8 لذلك فإن هذه الخطوة تتم خلال 


زمن قدره ”ره من أجل ثابت ما ر٥.‏ 


الخطوة 5: طالما أن " هو المتوسط في عناصر |8|/Q‏ فهناك عدد من العناصر قدره |8|/2@Q‏ أكبر 
منه أو مساوية له . كل من عناصر 5/0) هي نفسها المتوسط لمجموعة من العناصر Q0‏ وهذا يعني 
أنها تملك عدد من العناصر قدره Q/2‏ أكبر منها أو مساوية لها. 


وهذا يعني أن عدد من العناصر قدره: 8|/4| = )|8[/2Q(‏ × (0/2) في $ من المضمون أن تكون أكبر 
من " أو مساوية ل ". وبالتالي : 3[8|/4 > |5| وباستتتاج مشابه فإن: 3|8|/4 > |8| 


في هذه الخطوة يتم الاسندعاء التعاودي لاجر اء EQUENT[A1L SELECT‏ للبحث إما في 5 أو 
في ر8 عن العنصر الأصغر وهذا يعني أن الاستدعاء التعاودي يتطلب زمن تابع لحجم المجموعة و8 
و 8 وهو الذي قمذا بحسابه(53|5]/4) › أي 4 ومنه نجد: 


يتطلب الاستدعاء التعاودي في هذه الخطوة للإجراء 7٣٤.]SE؟S SEQUENTIAL‏ زمن قدرہ 
.t(3n/4)‏ 
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من التحليل السابق لدينا : وع +رع + رع ديع t(n) = cn + t{n/Q) + t3n/4)  ;‏ 


الآن لنعين Q‏ : إذا اخترنا Q‏ كما يلي: ا > 3/4 + ./Q‏ عندها ينفذ الاأستدعاعين التعاوديين في 
الإجراء بتتابع شديد الانخفاض. وإن أي قيمة ل Q‏ > 5 ستسبب ذلك . 


لنأخذ 5= ومله نجد: t(n=e,n+t(n/5)+t(3n/4)‏ 

وهذه التعاودية يمكن حلها بالافتراض التالي : ٣ء٠‏ > (ه)) من أجل ثابت ما وت. 
وبالتالي: )190/20( t(n) < can + eg(n/5) + cs(3n/4) = cn + cs‏ 
أخيرا لنأخذ : په 20= وه ومنه نجد: ہو = t)n( > cی)/20( + e)19۸/20(‏ 
وهذا يؤكد افتراضنا أن : 0)١(‏ = (م) الذي افترضناه في عرض الحد الأدنى. 

3- الخصائص المطلوبة في الخوارزمية المتوازية للاختيار : 
هناك خصائص هامة نرغب في الحصول عليها في الخوارزمية المتوازية وهي التالية: 
1. عدد المعالجات: 


الخاصية الأولى هي عدد المعالجات المستخدمة في الخوارزمية. وبغرض ١"‏ هو حجم المسألة التي 
نرید حلها فإن: 


أ يجب أن تكون (")۴ أصغر من ١‏ : فمن غير الولقعي أن. نفترض أن المعالجات أكثر من 
مغردات المعلومات خاصة من أجل قيم كبيرة جدا ل 1. ولذلك من المهم أن تكون ۴)١(‏ تعبر عن 
دالة خطية في ١‏ › وهذا يعني: 
PMN=n ; 0<x<1‏ 

ب يجب أن تتكيف الخوارزمية مع :۴)١(‏ في الحساب بشكل عام وفي الحساب المتوازي بشكل 
خاص نحتاج إلى قوة حسابية إضافية فقد تطرح مسائل أكبر وأكثر تعقيداً أكثر مما كان محتملاً قبل 
ذلك. وهذه المسائل الأكبر قد تجعل الخوارزمية عديمة النفع تماماً. وتستخدم الخوارزميات عدد 
المعالجات على أنها دالة خطية في ١‏ مثل ”۸ , ۸" ه1 و قد تكون غير مرضية بسيب عدم مرونتها. 
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ما نحتاجه هو خوارزمية تمتلك الذكاء لكي تكبف مع عدد المعالجات الحقيقي المتوفر على الحاسب 
الموجود. 


2. زمن التنفيذ: 
الخاصية الثانية من الخاصيتين المهمتين هو زمن تتفيذ أسوأً حالة للخوارزمية المتوازية. 
أ يجب أن تكون («)) صغيرة : الدافع الأساسي لبناء الخوارزمية المتوازبة هو تسريع العمليات 


الحسابية. ولذلك من المهم أن تكون الخوارزميات المتوازية التي نصممها أسرع بشكل مميز من أفضل 
خوارزمية تسلسلية للمسألة التي بين أيدينا. 


ب“ يجب أن نتكيف الخوارزمية مع (1)۸ : فمثلاً قد يرغب شخص ما أن يملك خوارزمية يتناقص زمن 


تتفرذها كلما كان عدد المعالجات المستعملة أكبر. فمن المرغوب أن 1)١(‏ تتغير بشكل متتاسب (عكسيا) 
مع )١(‏ بدون مجموعة الحدود ل (د)م. 


4. الكلفة : 
أخيرأً نرغب بالحصول على خوارزميات متوازية يتحقق فيها : 
c(n) = p(n) * t(n)‏ 


والتي تنسب الحد الأدنى المعروف للخوارزمية على عدد العمليات التسلسلية المطلوبة في أسوأً 
حالة لحل المسألة. وبمعنى آخر الخوارزمية المتوازية ستكون بأفضل كلفة. 


إن اجتماع الخواص السابقة عادة يكون صعباً وفي بعض الأحيان مستحيلا. وبشكل خاص عندما تكون 


المعالجات المتعددة موصولة عن طريق شبكة اتصالات حيث أن الشكل الهندسي للشبكة يفرض حدودا 


على ما نستطيع إتمامه عن طريق الخوارزمية المتوازية. ولكن الأمر مختلف تماما عندما تكون 
الخوارزمية منفذة على حاسب متوازي بذاكرة مشتركة » فلا نهتم كثيرا هنا بهذه الخواص إذ أن 
النموذج يكون قوياً ومرناً. 

بالنسبة للخوارزمية المتوازية التي سنصفها بعد قليل من أجل اختيار العنصر الأصغر K‏ في المتسلسلة 
(صك,..,1,2ء)=8 ٠‏ والئي سننفذ الخوارزمية على حاب EREW SM SIMD‏ مع N‏ معالج حیٹ 
م>. نجد أن الخوارزمية تتمتع بجميع الخواص السابقة: 
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1- إنها تستعمل المعالجات “أ = («)م حيث: 0>×>1 ويمكن الحصول على قيمة × من 
العلاهة: ”م =ل. لذلك فإن (م)م خطية ومتگيغة .sublinear and adaptive‏ 

 -2‏ إنها تتفذ في زمن (0)۸7 = (ه)1 حيث × تعثمد على عدد المعالجات المتوفرة على حاسب 
متوازي ويمكن الحصول عليها من العلاقة السابقة. لذلك فإن («) أصغر من زمن تتفيذ أفضل 
خوارزمية تسلسلية التي ذكرناها. كما أن الخوارزمية منكيفة مع زمن التتفيذ («)) فإذا كان الأكبر 


(«)ص فإن الأصغر (1)1 والعكس بالعكس. 
3- إنها تملك كلفة (م)0 = (م)0 ×“ "د = (م)٥‏ وهي الأفضل نظراً للحد الأدنى الذي 
ذکرناه سابقا. 


أخيرا عند التعامل مع القيم الحقيقية للأنواع المذكورة (مثلاً: *'" , *«) ستكون مدورة إلى أعداد 
صحيحة مناسبة لذلك فإن التمثيل الحقيقي ل * "ى عدد المعالجات المستخدمة في الخوارزمية سيفسر 
ك د*"۸ء وهذا من أجل أن يضمن أن النتيجة الصحيحة ليست متجاوزة العدد الحقيقي للمعالجات. 
وبالعكس التمثيل الحقيقي ل “« زمن نتفيذ أسوأً حالة للخوارزمية سيفسر ب ""” وهذا ليضمن أن 
النتيجة الصحيحة ليست أصغر من الزمن الحقيقي لننفيذ أسواً حالة. 


4- خوارزمية الاختيار المتوازي 


سندر س الان خوارزمية الاختيار المتوازي على laسب EREW SM SIMD‏ وهي معطاة بالإجراء 
PARALLEL SELECT‏ ولنفترض ما یلي: 


1- لتكن إمك..,ر8رر8=)5 متسلسلة من الأعداد الصحيحة › و kK‏ عدد صحيح حيث: 1>)k>N‏ › 
والمطلوب تحديد العنصر الأصغر K‏ في المتسلسلة 5S‏ وهذه هي الإدخالات البدائية للإجراء 
.PARALLEL SELECT‏ 

2- الحاسب المتوازي يتكون من N‏ معالج ہ",..,1,P2٥ ٠‏ 

3- كل معالج تلقى " وحسب × من العلاقة * أ = ل حيث 1> ×> 0. 

4- كل من المعالجات * "1 لها القدرة على ترتيب متسلسلة من “د عنصر في ذاكرته المحلية . 
5~ کل معالج یستطیع تiفيذ‏ الإڊرI« SEQUENTIAL , BROADCAST ڪs ALLSUMS:‏ 
SELECT‏ 

MM" -6‏ هي مصفوفة في الذاكرة المقسمة طولها ١N‏ ورمزها هو (ئ). 
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: PARALLEL SELECT(S,k) ءIرجإلا خوارزمي‎ 


الخطو ة1 : إذا كان 4 > || عندها يستعمل م خمس مقارنات على الأغلب لإعادة العنصر ) 
وإلا: 
1. قم المتسلسلة $ إلى *' |8| متسلسلة جزئية » طول المتسلسلة ;8 هو 
| حیث: "|8 |>1 ؛ 
2. المتسلسلة الجزئية :5 محددة للمعالج م . 
الخطوة 2: من أجل 1=1 إلى *" |8| نفذ على التوازي: 
1. [يحصل كل معالج رم على العنصر الأوسط ر ؛ العنصر "8¡|/2|" ؛ في 
مجموعته الجزئية المحددة] استدعي إجراء الاختيار التسلسلي من أجل القيم 
lتlلية:‏ )21/|;$[" , SEQUENTIAL SELECT(S;‏ 
2. يخزن المعالج م العنصر الأوسط "n:‏ في المصفوفة :1 
الخطوة 3: إيستدعي الإجراء نفسه تعاوديا للحصول على العنصر الأوسط ٣‏ من ]M‏ 
PARALLEL SELECT (M, "[M|/2")‏ 
الخطوة 4: نّم المتسلسلة 8 إلى ثلاث متسلسلات جزئية: 
L= {si €S:si<m }‏ 


E= {si €S:si=m } 
G= (si €S:si> mm} 


الخطوة 5: إذا كان K‏ < إإ عندها استدعي الإجرIء PARALLEL SELECT (L,K)‏ 
وإلا إذا کان k‏ < |٤]+إ]|‏ عندها أعد العنصر ۳ہ 
وإلا استدعي الإجرlء PARALLEL‏ 
.SELECT (G,K-IL|-[E})‏ 


Void PARALLEL SELECT(S,kK) 
{ : 
Stepl: if (S| 5 4) 
Pp, uses at most five comparasions to return the Ath element ; 


else 
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(i) S is subdivided into S| * subsequences S; of length |S| each, 
where 1<i<|S| 7, and 
(i) ْSubsequences S; is assigned to processor Pi ; 


Step2: for (i=1 , i<=]S} * ,i4+) in parallel 


{ 


(2.1) /* p; obtains the median m; , i.e., the |Si/2"th element, of its 
associated subsequence */ 


SEQUENTIAL SELECTS; , 8/2); 
(2.2) Pp; stores m; in Mi ; 
} 


Step3: /* the procedure is called recursively to obtain the median m of M 
*/ 


PARALLEL SELECT (M, IM|/2"); 
Step4: the sequence S is subdivided into three subsequences: 


L={si€S:si<m}, 
E= {si €S:si =m }, and 
G= {si €S:siz>m}. 
Step:  if(L|> K) 
PARALLEL SELECT (LO; 
else if (LIFE) > kK) 
return mM ; 
else 
PARALLEL SELECT (G,K-IL1-[E)D ; 


تحليل خوارajية‏ !لإجرIء PARALLEL SELECT (S,k)‏ : 
كالمعتاد سنرمز للزمن الذي يحتاجه الإجراء من أجل ۸ إدخال ب (ہ)): 


الخطوة 1: يحتاج كل معالج لإنجاز هذه الخطوة إلى العنوان البدائي ۸ للمتساسلة $ في الذاكرة 
المشتركة وإلى حجمها |5| وإلى قيمة .K‏ هذه الكميات يمكن نشرها إلى جميع المعالجات باستعمال 
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الإجراء 8۸0۸00481 وهذا يئطلب الزمن : أ۸ 0)02 » فإذا كان 4>|؟| عندها المعالج م 
يعيد العنصر K‏ في زمن ثابت وإلا :م يحسب عنوان أول وآخر عنصر في ;8 من العلاقتين: 

+1١" -1 , ۸ + )1-1( ۸ [‏ 4 ] على التوالي. ويمكن نتفيذ ما سبق في زمن ثابت لذلك فإن 
الخطوة 1 تأخذ ۸ عهآر» من وحدات الزمن من أجل ثابت ما ر . 


الخطوة 2: يقوم الإجراء SEQUENTIAL SELECT‏ بإيجاد العنصر الأوسط لمتسلسلة طولها 
في ٣ء‏ من وحدات الزمن من أجل ثابت ما ر. 

الخطوة 3: طالما أنذا نستدعي الإجراء PARALEL SELECT‏ من أجل متسلسلة بطول * "۸" 
فان هذا يتطلب زمن هو (۸)). 

الخطوة 4: يمكن أن تقسم المتسلسلة 8 إلى 1,8,6 كما يلي: 

1- ينشر ٣‏ إلى جميع المعالجات في زمن ( ۸ 0)1٥‏ مستخدماً الإجراء 0۸0٥481‏ 8۸. 


2~ كل من المعالجات :م قسم ;5 إلى ثلاث مجموعات متسلسلات جزئية :1 , ٤‏ , :6 من العناصر 
الأصغر من " والمساوية ل " والأكبر من ٣‏ على التوالي. ويمكن لهذا أن يتم في زمن أسي في 
حجم ¡8 وهذا الزمن هو (0)۸. 
3- تدمج المتسلسلات الجزئية :1 , ۴ , :6 في الشكل 1 , ۴ , 6 . وسنعرض كيف يمكن أن يتم هذا 
من أجل :1 وبإجراءات مماظة وبنفس زمن التنفيذ يمكن أن نستتتج دمج ٤;‏ ,0 على التوالي. 
لتکن || = ره » من أجل كل 1 حيث “أ > 1> 1 فإن المجموع يحسب من العلاقة: 

ز8 3-1 = 2 
يمكن أن نحصل على جميع هذه المجاميع من *" معالج في زمن (” "۸ عه!0)1 وذلك باستخدام 
الإجرا« .ALLSUMS‏ 


لتكن 0 = م › تقوم جميع المعالجات بدمج متسلسلاتها الجزئية بآن واحد بالشكل ا كما يلي: يقوم 
المعالج ۴ بنسخ 1 في 1 مبتدئًا بالموقع 1+ .< ويمكن أن يتم ذلك بزمن قدره (0)«7. ولذلك فإن 
الزمن المطلوب في هذه الخطوة هو ”وء من أجل ثابت مأ و. 
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الخطوة 5: حصلنا على حجم 1 الذي نحتاجه في هذه الخطوة من الخطوة السابقة من خلال حاب 
م7 . وكذلك بالنسبة لحجمي 6 , 8. ويجب علينا الآن تحديد الزمن المستهلك من كلا الخطرقن 
التعاوديتين. طالما أن " هي العنصر الأوسط في 4 فإنه لدينا 1/2 عنصر هي بالتأكيد أكبر منه. 
علاوة على ذلك فإن كل عنصر من M1‏ أصغر على الأقل من 0/2 عنصر في ؟. لذلك (Lis3n/4‏ 
وبشكل مشابه فإن 3/4 > || وبالتالي فإن الخطوة 5 تتطلب على الأغلب زمن (3/4). 


إن التحليل السابق ينتج التعاودية التالبة ل (م)) : 
T(n) = cılog(n) + ca n" + t(n"™) + cn” + t{3n/4)‏ 
والتي حلها هو 0)١(‏ = (م)1 وذلك من اجل 4 < م 
طالما أن ”أ = (م)م فإنه لدينا: 
c(n) = p(n) x t(n) = n'* x O(n") = O(m)‏ 
وهي الكلفة الأفضل المستنتجة في عرض الحد الأدنى سابقاً. 


ومن ناحية أخری نلاحظ أن *" أكبر من ۸ عها من أجل أي × (وقد استعملنا هذه الحقيقة عند تحليلنا 
لاإجر« )PARALLEL SELECT‏ وطالما أن *'ہ = N‏ و n/n" > vlogn‏ فهذا يعطي أن 
اإإجرlء PARALLEL SELECT‏ له أفضل كلفة حیث 1 N > /10g‏ 


مثال (7-3): يوضح عJa‏ lلإڄراء :PARALLEL SELECT‏ 
لتكن لدينا المجموعة التالية: 


S = {3,14,16,20,8,31,22,12,33,1,4,9,10,5,13,4,24,2, 14,26, 18,34,36,25 ,14,27 32,35,33 


فیها: 29م . 
ولتگن 1ا أي أننا نريد تحديد العنصر الواحد والعشرين في 8. 


لنفترض أن الحأسب EB۴EW SM SIMD‏ المتوفر يحتوي على خمس معالجات أي أن: 5=×. 
ومنه5=* "|8| مما یدل علی أن : 0.47796 = × 
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بتم إإخال المتسلسلة مبدئباً في الذاكرة كما بظهر في الشكل (8-3): 


ats 20| a [orf 2| 2 [oo] 1 elo [ro | s [i |7 [ae [2 [re [ 26 [1e [4 [26 [2s |r [2 [32 [25] 


٠‏ بعد الخطوة 1 يكون كل معالج قد حدد المتسلسلة الجزئية في 5S‏ حيث يتلقى كل من المعالجات الأربعة 


الأولى ستة عناصر من المجموعة والمعالج الخامس يأخذ العناصر الخمسة المتبقية كما يلي: 
3,14,16,20,8,3{ 
}22,12,33,1,4,9{ 
}10,5,13,7,24,2{ 
}14,26,18,34,36,25{ 
}14,27,32,35,33{ 


يقوم الآن كل معالج بإيجاد العنصر الأوسط في متسلسلته الجزئية في الخطوة 2 ويقوم بتخزينه في 
مصفوفة 1 في الذاكرة المقسمة وهذا موضح في الشكل التالي: 


|7)25|32 |9 |14 
عندما يستدعى الإجراء 1 ARA ٤[ S٤18٣‏ ۴ تعاودياً في الخطوة 3 فإنه يعيد العنصر الأوسط 
m=14‏ في M‏ 


في الخطوة 4 يتم تشكيل المتسلسلات الجزئية الثلاثة ل$ المسماة 6,8,1 من الحناصر الأصغر من 
4 والمساوية ل 14 والأكبر من 14 على التوالي وهذا موضح في الشكل التالي: 


E E E BIE E 
3| |2| |4| د‎ || s | 6د | د | |26| 2| دد |عع| دد إدد| 6د | م ]هد |2| |د‎ |2 |2 |2] ][ 
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طالما أن ]E| = 3, | + |٤| > k‏ , 11 = إ| فلن الإجراء PARALLEL SELECT‏ یستدعی 
تعاودياً في الخطوة 5 حيث 8=6و 11+3(=7)- 21 = ) 


طالما أن 6|=15| فإننا نستعمل 15'*=3.6485 حيث أن ثلاث معالجات تقف خلال هذا التعاود ومرة 
أخرى في الخطوة 1 يقوم كل معالح بتحديد خمس عناصر كما يظهر في الشكل التالي: 


_16| 2031122 33| 


أما المتسلسلة M‏ التي تحدد في الخطوة 2 مبينة في الشكل: 
العنصر الأوسط 26=" يحدد في الخطوة 3 


المتسلسلات الجزئية الثلاث 1,5,6 المنشأة في الخطوة 4 مبينة في الشكل: 


16] 20] 22| 24| 18| 25|] 26| 31| 33] 34| 36| 27| 32| 35| 33| 


الشكل (8-3( تطبيق عمJ‏ !لجرا« PARALLEL SELECT‏ 
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بما أن 1=إع| , 16| فإن العنصر الوحيد في ٤‏ وهو 26 هو الذي يعود على أنه العنصر الواحد 
والعشرين في الإدخال وهو المطلوب. 


ومنه نجد أننا حصلنا بنجاح على خوارزمية تنفد على النموذج EREW SM SIMD‏ وهذه 
الخوارزمية أسرع ومتكيفة مع عدد المعالجات وزمن التتفيذ ولها كلفة آمثلية وبالتالي الخوارزمية 
المتوازية تزودنا بأفكار تقود إلى تطوير الخوارزمية التسلسلية الأفضل الموجودة. 


2-5-3 مسألة الدمج: 


وهي أحد مسائل المقارنة ويمكن أن نعرفها كما يلي: لتكن إ,ا,..,را,رطا)=8 , إيه,..,3,رA=)a‏ 
متسلسلتين من الأرقام المرتبة تصاعدياً والمطلوب دمج كلا المتسلسلتين 8 , ۸ وذلك لتشكيل متسلسلة 
ثالثة ©: [يبم,..,1,02) = © مرتبة تصاعدياً. حيث أن كل من العناصر إت في © تنتمي إما إلى ۸ 
أو إلى 8 وكل من العناصر نه و ا تظهر مرة واحدة فقط في ©. 


1-2-5-3 شبك :NETWWORK FOR MERGING gall‏ 
يمكننا أن نحصل على شبكة غرض خاص لإنشاء التوازي بأي من الطرق التالية: 


1ك استعمال معالجاتث متخصصة مع شبكة الاتصالات التقليدية. 
2 استعمال شبكة اتصالات مصممة بشكل عادي لربط معالجات قياسية. 
3= استعمال خليط من 1 و 2. 


ستأخذ في دراستنا لهذه المسألة الحالة الثالثة حيث سيتم الدمج عن طريق مجموعة من المعالجات 
البسيطة جداً متصلة بواسطة شبكة غرض خاص وهو البناء المتوازي وتعرف ب: 


/(r,s)-merging network/ (r,s) شبك دمج‎ 


إن جميع المعالجات المستعملة متماثظة وتدعى المقارئات sإمادإدمصهء.‏ يتلقى المقارن إدخالين 
ويصدر إخراجين كما يوضح الشكل (9-3). 


103 


All Rishts Reserved - Library of University of Jordan - Center of Thesis Deposit 


العنصر الأصغر بين y3X‏ 


العنصر الأكبر بين ×وب 


العملية الوحيدة التي يستطيع المقارن إنجازها هي مقارنة قيم الإدخالين الخاصين به ومن ثم وضع 
الأصغر منهما في قمة خطوط الخرج والأكبر منهما في أسفلها. 


سنبداً باستعمال تلك المقارنات لبناء شبكة تأخذ دخلها المتسلسلتين المرشثين التاليتين: إيه,..,ر4,ر۸=)4 
B= {bıyb2,..,Dr}‏ وتنتج خرجها المتسلسلة المرثبة الوحيدة: C= {C1,C2,.-,Crs]‏ 


سنفت رض للتوضيح مأ يلي: 


1- المتسلسلتين المدخلتين لهما نفس الحجم : | <"=و=؟ 
2= × هي قوةل 2 


سنوضح الان كيفية إنشاء شبكات الدمج من أجل القيم الثلاث الأولى ل .١‏ 


. عندما 1<«: يكفي لإنشاء شبكة الدمج مقارن وحيد حيث ينتج إدخاليه بشكل مرثب. 
" عندما 72ہ: المتسلمسلئين {a1822} ,B= {bı,b2}‏ = 4 يتم دمجها في الشبكة كما هو موصضح 


في الشكل (10-3): 
a1‏ 
ا 


C1 


C2 
C3 

bı 
C4 

b2 


الشكل(10-3) يوضح شبكة خاصة لدمج متسلسلتين شائيتين 
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ويمكن إثبات هذا بسهولة : يقوم المعالج ,م بمقارنة العنصر الأصغر في 4 مع العنصر الأصغر في 
8 فتكون القيمة العليا في الخرج هي العنصر الأصغر في € والذي هو ر٠.‏ وبشكل مشابه القيمة 
السفلى في خرج المعالج رم يجب أن تكون و٠.‏ بالإضافة على مقارنة أخرى تتم عن طريق رم الذي 
سينتج العنصرين الأوسطين في .٣‏ 


. عندما 4=«: نستطيع أن نستعمل شبكتين مماثتين للشبكة السابقة يتبعها ثلاث مقارنات كما 
يظهر الشكل (11-3) من أجل : [2,4,6,8) = 8 , 3,5,7,9) = ۸ 


الشكل (11-3) شبكة دمج من أجل حجم المتسلسلتين 4<" 
بشكل عام يمكن بناء شبكة دمج )٣,۸(‏ بالتعاود التالي: 
ولا دمج العناصر ذات الأدلة الفردية في 8B‏ وھذە العناصر هي: }41,83,35,31{ 


{b,D3,Ds,..,Dn-1}‏ وذلك بواسطة شبكة دمج(2,1/2/ہ) لتنتج متسلسلة .{dı,d2,d3,..,dn}‏ وبنفس 
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الوقت تدمج العناصر ذات الأدلة الزوجية والتي هي: (مط,..,مط,4طررطا) [مك,..,4,44,3) باستعمال 
شبكة دمج (1/2,/2) لتتتج متسلسلة [مع,..,د2,8ع,٠).‏ ويمكن أن نحصل على المتسلسلة النهائية 
(م1,2,3..,2) كما يلي : 


Cı = dı , Con = €n , Ci 2 Min(di+, €) , C241 = Max(di+ı, €) ; i*1,2,..,0-1 


أما المقارنات النهائية فهي 1-1 مقارن كما هو موضح في الشكل (12-3). 


Cail 


الشكل (12-3) شبكة دمج (١رہ)‏ 


نلاحظ أن كل من شبكتي الدمج (1/2,0/2) تبنى بتطبيق نفس قاعدة التعاود وذلك باستعمال شبكات 
دمج (1/4,/4) يتبعها رتبة مقارنات 1-(2/.). وقد أنشأت شبكة الدمج في الشكل (12-3) بناء على 
نظرية معروفة الدمج (زوج › فرد) ومنه فهذه النظرية تعمل بشكل عام كما يلي: 


€n = maxX (82a, ba) , dı = min (ar, bı) 
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وهذا يعني أن ٥و ٥‏ حسبت تماما. 


نلاحظ أنه في المثسلسلة [ل,..وول,دل,ك) جميع العناصر إل أصغر أو تساوي ل بزل وكل عنصر 
من هذه المجموعة هو أحد عناصر ۸ أو 8 ذات الأدلة الفردية لذلك فإن العناصر 21 من ۸ أو 8 
هي أصغر أو تساوي بز ومنه: زره <ربزف. وبشکل مشابه زر <۵. 

ومن جهة أخرى بالنسبة للمتسلسلة [مدء,..وو٥رد٥,ر٥)‏ فإن العناصر 21 من ۸ أو 8 أصغر أو تساوي 
ربزدت وهذا يعني أن بده أكبر أو تساوي العناصر 1+1 ذات الأدلة الفردية التي تنتمي إما إلى ۸ أو 
B‏ , ومنه: + < 1بے٥.‏ وبشکل مشابه فإن ۴ < رباد ؛ ومنه: ررر > زد وهذا التباين الناتج يدل 

سا على أن : 


C241 = MAX (dir, €) , ca, = min(dı+1, €) 


وهو المطلوب. 
2-2-5-3 خواص شبكة الدمج (زوج › فرد): 


سنركز في تحليلنا للدمج (زوج › فرد) على الزمن وعدد المعالجات ونتيجة عدد العمليات المطلوبة 
للدمج. 


1- زمن التنفيذ: 


في البداية سنفترض أنه يمكن للمقارن أن يقرأ إدخاله وينجز المقارنة ويصدر خرجه وذلك كله في 
وحدة زمن واحدة. ولنرمز للزمن المطلوب من شبكة دمج (ہ,٥)‏ (لدمج متسلسلتین کل منھما بطول ۸) 
ب (2۸)). 
تخضع هذه الشيكة للتعاود التألي بالنسبة للزمن :t{2n)‏ 
;n=1l‏ 1= )2{ 
t{2n) = t(n) +1 ;n>1 |‏ 
ومنه يكون: ۸ عه1+1 = (م1)2 وهو أسرع من زمن التنفيذ (0)7 المحقق على حاسب تسلسلي. 


2- عدد المعالجات: 
لنحسب عدد المقارنات المطلوبة للدمج (زوج » فرد) » ولنرمز ب (١2)م‏ لعدد المقارنات في شبكة 


دمج (”ر«). ومرة أخرى لدينا التعاودية التالية: 
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p2) = | ;n=1 
p(@n) = 2p(n) + (n-1) ;n>1 


و4ie: p(2n) = Hn log n‏ وهو بسيط أيضا. 
3- الكلفة: 


طالما أن: n log nو t2n) = 1 + log n‏ + 1 = (2n)م‏ فإن كلفة الشبكة هي: 
log?n)‏ )0 = («2)ا × («2)م = («2)ء ومنه فإن كلفة الشبكة ليست أفضلية فهي تنجز عمليات 


أكثر من (0)۸ الكافية للدمج التسلسلي. 


قمنا بعرض مثال عن بناء شبكة الدمج » وشبكات الدمج هذه لها خاصية هامة هي أن سلسلة المقارنات 
التي ستنجزها ثابتة مسبقاء بغض النظر عن الدخل › ولذلك تعرف بأنها شبكات كثرة النسيان 
لإدخالاتها. وقد رأينا في التحليل أن شبكة الدمج ),١(‏ المدروسة أسرع بكثير بالمقارنة مع خوارزمية 
الدمج التسلسلية المحتملة الأفضل › وكمثال يمكن دمج متسلسلتين كل منهما بطول 2 عنصر في 
واحد وعشرين خطوة . وتتطلب نفس النتيجة أكثر من مليوني خطوة على حاسب تسلسلي. ولسوء 
الحظ فقد تم تحقيق هذه النتيجة ولكن باستعمال عدد كبير وغير معقول من المعالجات » فمن أجل 
2= ستتالف شبكة دمج («,«) من أكثر من عشرين مليون مقارن بالإضافة إلى أن بناء الشبكة غير 
منتظم بشكل بالغ والأسلاك التي تصل المقارنات لها طول متغير ب ١‏ › وهذا يعني أن شبكة الدمج 
ستكون غير عملية من أجل قيم كبيرة ل ۸. 


3-2-5-3 الدمج على النموذج :CREW‏ 


مسألة الدمج (زوج › فرد) تعتمد على الشبكات الجامدة أي التي تجمع عدد ثابت من المقارنات في 
نشكيلة لدمج متسلسلات بحجم ثابت. وبالرغم من أن ذلك كاف في بعض التطبيقات فإنه من المستحسن 
الحصول على خوارزمية متوازية تتكيف مع عدد المعالجات المتوفرة في الحاسب المتوازي المتوفر. 
سنصف في هذا المقطع إحدى هذه الخوارزميات ومع كونها أسرع فإن لها كلفة أفضلية أيضاً حيث 
يضرب زمن التنفيذ بعدد المعالجات المستخدمة ويساوي عامل ضرب ثابت وهو الحد الأدنى لعدد 
العمليات المطلوبة للامج. 


تعمل الخوارزمية على حاسب من النمودج «CREW SM SIMD‏ وهي نقذرض وجود الإجراء 
التسلسلي لدمج متسلسلتين مرتبتين ولذلك سنبداً بإيجاد ذلك الإجراء. 
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:SEQUENTIAL MERGING ينسلٹlسیتلا إجراء الدمسج‎ -1 


لیکن لدينا : {a1,32,..8s} 5 B = {b,,b2,..,D,}‏ د متسلسلتین من الأرقام المرئبة تصاعديا 


والمطلوب دمج 8 , ۸ لتشكيل متسلسلة ثالثة © : إ[يبم1,02,..,0٥]‏ = € مرتبة تصاعديا. 


ستتم عملية الدمج هذه بواسطة معالج وحيد » ويمكن أن يتحقق ذلك عن طريق الخوارزمية للتالية: 
تقوم المؤشرات بداية بالتأشير على العناصر ,وط على التوالي . ومن ثم ينتسب الأصغر بينهما إلى 
ره ومؤشر المتسلسلة الذي يؤشر على > يتقدم موضع واحد . مرة أخرى تتم مقارنة العنصرين 
المؤشر عليهما ويصبح الأصغر ده وبعدها يتقدم المؤشر. وتستمر هذه العملية حتى نتتهي إحدى 
المتسلسلتين المدخلئين وئنسخ العناصر المتبقية في المتسلسلة الأخرى في °. 


: SEQUENTIAL MERGE (A,B,C) ةaراوخ‎ -2 


الخطوة 1: 
i—1‏ 
j-1‏ 
الخطوة 2: 
من أجل k1‏ إلى وم نفذ: 
اذا کان bj‏ > إ2 عتدها: بويع 
i—j+1‏ 
وإلا ۳ cx—bj‏ 
jj+1‏ 


Void SEQUENTIAL MERGE (A,B,C) 


(1.1) i1 
(1.2) j—1 
for (k=] , k <= rts, kFF) 
if (aj < bر(‎ 
(i) ek+-aj 
(i) i—i+1 
else 
0) cx—b; 
(i) j+j+1 
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نلاحظ أنه بما أن كل مقارنة تعطي واحد من عناصر © فإنه يوجد ء + ۲ مقارئة وفي أسوأ الحالات 
عندما " = ء = ع نقول أن الخوارزمية تنفذ في زمن (م)0 وكما رأينا عند عرض الحد الأدنى للدمج 
فإن الإجر اء SEQUENTIAL MERGING‏ أفضلي. 


:PARALLEL MERGING يjlوتمنا إالندمج‎ -3 


يتألف الحاسب CREW SM SIMD‏ من N‏ معالج ,۴,,۴2,۴,..,۲ والمطلوب تصميم خوارزمية 
متوازية لهذا الحاسب تأخذ المتسلسلتين ۸ و 8 كدخل وتنتج المتسلسلة ° كخرج. 

لنفرض أن 5 > ۲ ومن المفترض أن الخوارزمية تحقق الخواص التالية: 

1- يجب أن يكون عدد المعالجات المستخدمة في الخوارزمية إدعماااناء و عم۷اموله متكيف. 
2 يجب أن يكون زمن تنفيذ الخوارزمية متكيف وأصغر من الخوارزمية التسلسلية الأفضل. 

23 يجب أن تكون الكلفة أفضلية. 

هذه الخوارزمية تستخدم N‏ معالج حيث >٣‏ وفي أسواً الأحوال عندما ۸" = 8 = ۲ فإن زمن تتفيذها 
يكون (م عه!+(0)),/N‏ لذلك فإن الخوارزمية أفضلية من أجل ۸ عه[/م> N‏ . 


بالإضافة إلى توفر الدالات المنطقية والبناء الأساسي لكل من ال N‏ معالج فإنه يفترض أيضاً قدرتها 
على إنجاز الإجراعين التاليين: 
2- الإجراء NAR ¥ SEARCH‏ الذي نشرحه فیما يلي: 


يأخذ هذا الإجراء المتسلسلة إمك,..,و8,رء,5)=$ من الأعداد المرتبة بشكل متزايد بالإضافة إلى 
متحول × 


إذا كانت × تتتمي إلى 8 عندها يعيد الإجراء الدليل K‏ للعنصر ١»‏ في $ كالتالي: » = × . وإلا يعيد 
الإجراء قيمة الصفر. يعتمد الإجراء 8]N.۸۸۷ S5۸4۸ ٣8‏ على أسلوب فرق تسد حيث أنه في كل 
مرحلة تتم مقارنة بين × و عنصر من 5 فإما أن العنصرين متساويان وينتهي الإجراء أو أن نصف 
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عناصر المتسلسلة الئي قيد البحث والمنافشة تطرح جائبا. سئمر هذه العملية حثى يصبح عدد العاصر 
المتبقية 0 أو 1. وبعد مقارنة واحدة على الأكثر ينتهي الإجراء. 


‘BINARY SEARCH (S , x , k) خوارزمي‎ -4 


الخطوة 1 : 


الخطوة 2: 
طالما أن 


1 ~1 
hn 
` k +-0 


i<h 


ذفذ: 


m < (ith)/2 

إذا کان وء = × عندها 
k+- m‏ 
h+]‏ ~1 


و إلا إذا كان رو > × عندها [-ص س ط 


1cmF*l Yj}, 


Void BINARY SEARCH (S , x, kK) 


{ 
stepl: (1.1)i 1; 
(1.2) h n; 
(1.3) k 0; 
step2: while (i <= h) 
2.1) m~ | (i+hy2J; 
(2.2) if (x * sn) 
(Dk m; 
i)i h+1; 
else if (xX < Sm) 
h~m-l ; 
else 
icmtl ; 
} 
} 
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طالما أن عدد العناصر التي قيد المناقشة يختصر في كل مرة إلى النصف فإن الإجراء يتطلب زمن 
(” ع0)10وذلك في أسوا الأحوال. 


سنشرح الآن أول خوارزمية دمج متوازية من أجل حاسب بذاكرة مشتركة: 


: CREW MERGE (4A , B , °) خوارزمي‎ -5 


أولاً سنحدد N-1‏ عنصر من ۸ حيث سنقسم تلك المتسلسلة إلى × متسلسلة جزئية لها نفس الطول 
بشكل تقريبي ولتكن المتسلسلة الجزئية المشكلة من تلك ال N-1‏ عنصر هي "۸ ونختار المتلسلة 
الجزئية '8 من 1- عنصر من 8 بشكل مماثل. 


ثائياً ندمج '۸ و '8 في متسلسلة من التكرارات ( دبج ۷,.,و۷رد۷ر۷=)]۷ حيث يتألف كل تكرار من 
عنصر من '4 أو '8 يتبعه موضعه في 4 أو 8 ويتبعه اسم المتسلسلة التي ينتمي إليها أصلاً والتي 
هي ۸ أو 8 . 
ثالثا يدمج كل معالج ويدخل في ١‏ عتاصر المتسلسلتين الجزئيتين واحد من ۸ و واحد من 8. يكون 
الفهرس للعنصرين واحد من 4 وواحد من 8 لكل معالج لكي يبدا الدمج أولاً ثم ليحسب ويرتب في 
مصفوفة من الأزواج المرتبة. 
الخطوة 1: [ حدد N-1‏ عنصر من 4 حيث سنقسم تلك المتسلسلة إلى N‏ متسلسلة جزئية لها نفس 
الطول بشكل نقريبي ولتكن المتسلسلة الجزئية المشكلة من تلك ال N-1‏ عنصر هي '۸ .ونختار 
المتسلسلة الجزئية '8 من ×N-1‏ عنصر من 8 بشكل مماثل. تتفذ هذه الخطوة كما يلي: ] 
من أجل 1= إلى ×N-1‏ نفذ على الثوازي: 

المعالج زم يحدد زه و ;اا من: 1ء ونج سه إإج 

bi bim 2 

الخطوة 2: [ ادمج A'‏ و '8 في متسلسلة من التكرارات 2بر ۷,.۔,د۷ر ۷2ر ۷=)۷ حيث يتألف كل 
تکرار من عنصر من '۸ أو '8 يتبعه موضعه في 4 أو 8ويتبعه اسم المتسلسلة التي ينتمي إليها 
أصلا والتي هي ۸ أو 8 ويتم التتفيذ كما يلي:] 
1- من أجل 1=¡ إلى ×N-1‏ نفذ على التوازي: 
| المعالج ;م يستعمل الإجراء BINARY SEARCH‏ على '8 لكي يجد العنصر 
الأصغر ز مئل راط > ج 
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ف إذا كان إ موجود علاها (4,أو' )4‏ إ۷ 
وإلا (ھرjl‏ 2( 7 Vex-1‏ 
2“ من أجل 11 إلى N×N-1‏ نففذ على التوازي: 
ً- المعالج م يستعمل الإجراء BNAR ۷ SE۸AR ٣8‏ على '۸ لكي يجد العنصر الأصغر 
ز كما يلي: ;۾ > "طا 
ت إذا کان ز موجود عندها (8 ,لر )٥'‏ ¬ ١۔زن۷‏ 
Vi-1 < (b'İ,B) Yg‏ 
الخطوة 3: [يدمج كل معالج ويدخل في © عناصر المتسلسلتين الجزئيثين واحد من ۸ و واحد من 
8. يكون الفهرس للعنصرين واحد من 4 وواحد من 8 لكل معالج لكي يبدأ الدمج أولاً ثم ليحسب 
ويرتب في مصفوفة من الأزواج المرتبة. تتفذ هذه الخطوة كالتالي:] 


Q(1) “= (1,1) -1‏ 
2~ من أجل 1-2 إلى N‏ فذ على التوازي: 
إذا کان (۸,)م'ھ)=ےرر۷ عندھا المعالج رم : 
)1( يستعمل الإجراء BINARY SEARC#‏ على 8 لكي يجد العنصر الأصغر ز كما 
ڀلي: ۾ < زا 
Q() — (k [rnl,j ) (2)‏ 
وإلا المعالج :م : 
0G)‏ يستعمل الإجراء ګ#SEARC BINARY‏ على ۸ لكي يجد العنصر الأصغر ز كما 
يلي: »اا < زه 
Q() “ G,kÎ snl ) (4)‏ 


3- من أجل 1=¡ إلى N‏ فذ على التوازي: 

المعالج ;ص يستعمل الإجر اء SEQUENTIAL MERGING‏ و (ر,x)‏ = Q)1(‏ لدمج مثسلسلتین 
جزئيتين واحدة تبدأً ب 4 والأخرى ب را وتوضع نتيجة الدمج في مصفوفة € تبدأً في الموضع 
1-ر+× ويستمر الدمج حتى: 

1- يواجه عنصر أكبر أو يساوي لأول عنصر في ر۷ في كل من ۸ و 
B‏ (عندما .(i 5 N-1‏ 

2- لا يوجد أي عنصر متبقي في ۸ أو 8 (عندما =١‏ 1). 


Void CREW MERGE (A , B,C) 
{ 
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Step1: for (i=1, i < N, i+) in parallel 
Processor pi determines a'; and b'; from 
(1.1) a; — din 
(1.2) b'i + birn 

Step2: (2.1) (i=1 „i <N , i+) in parallel 


(i) processor p; uses BINARY SEARCH on B' to find the 
smallest j such that a’; < b'j ; 
(i) if {j exists) 
vi. ¬ (a ( ; 
else 
VieN-1 €7 ر (ھرل'ھ)‎ 


} 
(2.2) for (i=l , i <N , i++) in parallel 
{ 


(i) processor p; uses BINARY SEARCH on A' to 
find the smallest j such that b'j < a; ; 
ûi) ifj exists) 
Virj-1 CT (b'i,B); 
else 
Vin-1 < (b'pi,B) ; 


} 
Step: G.DQ() (1,1) 
(3.2) for (i=2 , i <= N , i+) in parallel 
if (va227{a'k,k,A) ) processor Pp; 


(i) uses o SEARCH on B to find the smallest j such that bj 
> a 
û) QO (k Tenl,j ): 
2 processor Pj 
G) uses O SEARCH on A to find the smallest j such that aj 
O) QOD Ok sal ); 
(3.3) for (i=2 „i N , it) in parallel 


processor p; uses SEQUENTIAL MERGING and Qû) 
= (x,y) to merge two subsequences one beginning at 2x 
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and the other at by, and places the result of the merge 

on array C beginning at position xty-1 . the merge 

continues until 

{DD an element larger than or equal to the first 
component of v2; is encountered in each of A 
and B (when i <N-1 ) 

(l} nro elements are left in either A or B (when i = 


N); 
ملاحظات:‎ -6 


1“ في الأمظة العامة إذا تمت مقارنة عنصر :۾ من ۸ مع عنصر زط من 8 لتحديد أييما 
الأصغر وكانت النتيجة أن زاح عندها يكون قرار الخوارزمية بشكل حكمي أن ;ج هي الأصغر. 
2- نتم عمليات القراءة المتداخلة عندما يستخدم الإجراء BNAR ¥ SEARC8١‏ بالإضافة إلى 
أنه كل من هذه المعالجات نتفذ البحث الثنائي على نفس المتسلسلة. 


7- تحليل خوارزمية )© , CREW MERGE (A , B‏ : 
سنحلل الإجراء ۸8EW MER6G٤‏ خطوة بخطوة كما يلي: 


الخطوة 1 : يقوم كل معالج من المعالجات التي تعمل على التوازي بحساب متساسلتين جزئيتين لذلك 
فان هذه الخطوة تتطلب زمن ثابت. 


الخطوة 2 : هذه الخطوة تتألف من تطبيقين للإجراء BN AR¥ SE£ˆA R٣3٩‏ لمتسلسلة بطول NN-1‏ 
كل منها متبوع بعبارة محددة وهذا يأخذ زمن ×N(‏ 0)10 . 


الخطوة 3 : الخطوة 1-3 تتالف من زمن محدد. والخطوة 2-3 تتطلب على الأغلب زمناً قدره 
( ګ0)10. لتحليل الخطوة 3-3 نلاحظ أولاً أن ۷ تحتوي على 2۸-2 عنصر حيث تقسم © إلى 
2-1 متسلسلة جزثية مع حجم أعظمي يساوي إلى (۸1/ء +| )]١‏ وهذا الحجم الأعظمي يحدث 
إذا کان مثلا عنصر ما به من ۸ يساوي عنصر ما زط من 8 عندها العناصر ٣/۸۱‏ أصغر أو 
تساوي به (وأكبر أو تساوي 1.1) وهي أيضا أصغر أو تساوي زط. وبشكل مشابه العناصر ۸ء 
التي هي أصغر أو تساوي زط (وأكبر أو تساوي -زطا)هي أيضاً أصغر أو تساوي ه. 
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في الخطوة 3 بقوم كل معالج بإشاء اثتين من الملسلات الجزئية من © ولنلك فإن حجمها ليس 
أكبر من ([۸/ء] + ٣/۸‏ )2 ما عدا بم الذي ينشئ متسلسلة جزئية واحدة من € وهذا يعني آن 
الإجراء SEQUENTIAL MERGING‏ يأخذ على الأغلب زمن N(‏ / (ك+٣))0‏ وفي أسواً 
الحالات عندما ۸ = ۽ = ٣‏ وطالما أن × < ١‏ فإن زمن تنفيذ الخوارزمية يحدد عن طريق الزمن 
المطلوب في الخطوة 3 ولذلك: 


t(2n) = O(n/N) + log n 
طالما أن × = (م2)م منه نجد:‎ 


c(2n) = p(2n) x t(2n) = O(n + N log n) 


وكلفة الخوارزمية أفضلية عندما ۸" عها/م > .×N‏ 
4-2-5-3 الدمج على النموذج :EREW‏ 


لقد رأينا في إجراء الدمج المتوازي على النموذج C۸8۷‏ أن عمليات القراءة المتداخلة تمت في 
العديد من خطواته وسنعمل لإيجاد إجراء بتكيف للعمل على N‏ معالج في >lسپ EREW SM‏ 
5D‏ وهذا النموذج من لحراديب لا سمج باي محاولة قرام من ئر من معاج واحد من موقم 
واحد في الذاكرة. ما علينا فعله هو إيجاد طريقة لمحاكاة عمليات القراءة المتعددة وحالما نجد مثل هذه 
المحاكاة يمكننا عندئذ أن نستخدم خوارزمية الدمج المتوازي (وبشكل عام أي خوارزمية فيها عمليات 
قراءة متعددة) لإتمام كل عمليات القراءة في ذاكرة النموذج ۴۸٤EW‏ » إذأً نحن بحاجة للمحاكاة لتصبح 
الخوارزمية فعالة. 


نلاحظ أن تقديم جميع طلبات القراءة من موقع الذاكرة واحد تلو الآخر غير مكيف إذ أنه يمكن أن يزيد 
زمن التنفيذ بدالة ب N‏ في أسوأً الأحوال. من ناحية أخری فإن استخدام الإجراء 8RO0ADC°A۸81‏ 
السابق غير مناسب أيضا إذ أن عمليات القراءة المتعددة من موقع الذاكرة ليس بالضرورة أن تستخدم 

جميع المعالجات إذ أن هناك عدة مجموعات فرعية تحكمية من مجموعة المعالجات تعتمد على 
الوصول المحدد لمواقع مختلفة » موقع واحد لكل مجموعة جزئية. لذلك سنقوم بإيجاد طريقة لإنجاز 
التحاكي بواسطة الإجراء B۸^0٥١۸(°48T7‏ 11°PLEاMUL‏ الثالي: 


موقع في الذاكرة المشتركة. من أجل محاكاة هذه الخوارزمية على نموذج ٤۸٤۷‏ مع × معالج حيث 
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N = 2‏ و 1 < ¶. سنقوم في البداية بزيادة حجم الذاكرة من ۷ موقع إلى M)2۸-1(‏ فيصبح عندئذ 
کل من ال N1‏ موقع عبارة عن جذر لشجرة ثنائية مع ١‏ ورقة. وتملك مثل هذه الشجرة 1+ې مستوی 
ومجموعة من 2۷-1 عقدة كما يظهر في الشكل(13-3) من أجل 16=. 


المستوی 
NE‏ 
pr‏ | 3 
دل 


2 || |r | | || 


1 || | | ودا‎ +0 | jon) |p | 3 4 
o‘{[ILILILILIIILILILILILIIIILILIL 


D+15 {DH16 D417 D+i8 DH9 D+20 DH21 D422 D23 DH4 D25 D26 D+2? 28 D+29 +30 


P, P» P3 Py Ps Pi Pre Pie 
الشكل(13-3) تتظيم الذاكرة من أجل الإعلان المتعدد‎ 


تمثل عقد الشجرة مواقع متتالية في الذاكرة لذلك فإنه إذا كان الموقع © هو الجذر فإن خلفه اليساري 
واليميني هما 0+1 و 2+[ على التوالي. وبشكل عام الخلف اليساري واليميني ل×+0 هما 
241+ و 0+2+2 على التوالي. 


لنفترض أن المعالج ز۴ يريد في حالة ما أن يقرأ من موقع ما (1)ل في الذاكرة عندئذ سيضع طلبه في 
الموقع (1-1) + )N-1(‏ + ()ل ورقة الشجرة التي جذرها ([)ل. يتم ذلك عن طريق متغيرين محليين 
مبدئیین ل ;۲ : 

1- المستوى (1) الذي يخزن المستوى الحالي للشجرة الذي وصل إليه طلب وهو مبدئياً 0. 
10٥)( -2‏ الموقع (ا) الذي يخزن العقدة الحالية للشجرة التي وصل إليها طلب ۲١‏ وهو مبدئيا 
.)N-1( + )1-1(‏ نلاحظ أن ر۴ يحتاج فقط لتخزين الوضع في الشجرة المتصلة ب () حيث وصل 
طلبها وليس موقع الذاكرة الفعلي (1-:) + )N-1(‏ + (ن)ل. 
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الف هذه المحاكاة من مرحلئين؛ مرحلة سابفةً ومرحلة لحه تقوم المعالجاث خلال المرحلة لساب 
بما يلي؛ يشغل المعالج ر۴ في كل مستوى الخلف اليساري وذلك حسب أولوية له من أجل تحسين طلبه 
مستوى واحد للأعلى في الشجرة ويتم ذلك عن طريق ترميز موقع الأب بترميز خاص وليكن [1] 
عندها بقوم بتحديث مستواه وموقعه وفي هذه الحالة يجمد استدعاء الخلف اليميني من أجل الباقي من 
الإجراء وإلا (إذا لم يكن هناك معالج يشغل الخلف اليساري مثلاً) يمكن للمعالج الذي يشغل الخلف 
اليميني طلب موقع الأب وتستمر هذه العملية حتى يصل معالجين على الأغلب المستوى N(-1‏ ع10) 
حيث أن جميع المعالجات نقرأً القيمة المخزنة في الجذر تباعاً (على التعاقب) وتبدأ مرحلة الهبوط 
فتذهب القيمة التي قرأت حالاً إلى أسفل شجرة مواقع الذاكرة حثى نتم جميع طلبات القراءة من 


المعالجات. وبذلك تكون خوارزمية الإجراء MULT PLE 6۸0۸A05€°481‏ کكالتالي: 


: MULTIPLE BROADCAST(d(1),d(2),..,d(N)) ةıajرlyخ‎ ~1 


الخطوة 1: من أجل 1=1 إلى N‏ نفذ على التوازي: 
[ المعالج ص يأخذ المستوى (e1)1ء1‏ والموقع ]1!0٥)1(‏ 
1-1 ضع في المستوى ] القيمة 0 level()—0‏ 
2-1 ضع في الموقع القيمة loci) ~— NFi-2 NN+1-2‏ 
3-1 خزن [1] في الموقع (¡)ءه1+()4 
الخطوة 2: من أجل ۷-0 إلى N(-2‏ عه]) نفذ: 
1-2 من أجل 11 إلى N‏ نفذ على التوازي: 
[ المعالج م في الابن اليساري يتقدم إلى الأمام في شجرته] 
1-1-2 ضع في × الحد الأعلى الأصغري (إده!؟) للقيمة 1(/2-(:)ء10) 
X (loc(i)-1)/2‏ 
2-1-2 إذا كان (1)ءه1 فردي و 1)1(=vع۷ع]‏ عندها: 
(D)‏ ضع × في (1)ه1[ 
(ة) خزن [1] في الموقع (1)ءه1+(ن) 
(1) ضع 1eve1)1(+1‏ في 1eve1)¡(‏ 
2-2 من أجل 11 إلى N‏ نفذ على التوازي: 
[ المعالج رص في الابن اليميني يتقدم إلى الأمام (للأعلى) في شجرته إذا كان ذلك ممكناً] 
إذا كان >×+()4 لا يحتوي مسبقاً على الدليل [ز] من أجل بعض >>1 عندها: 
(i)‏ ضع × في 10٥)1(‏ 
(ii)‏ خزن [1] في(ن)ء10+() 
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1eve1)1( في‎ 1ev ع1)1(٣1 ضع‎ (iii) 
عه!) حب إلى 0 نفذ:‎ ۸N (-1 الخطوة 3: من أجل‎ 
نفذ على التوازي:‎ N من أجل 1=1 إلى‎ 1-3 
في الابن اليساري يقرأ من والده وينتقل بعدها إلى أسفل الشجرة]م[ المعالج‎ 


X— (loc(i)-1)2 1-1-3 

y (toc(i)x2)+1 2-1-3 

3-1-3 إذا كان (1)٥ه!1‏ فردي و0-()1ع۷ء] عندها: 
)( اقرا محتويات d)(+×‏ 

(i)‏ اكتب محتويات ×٣(:)ل‏ في الموقع (1)ءه!+()4 

1eve1)1( مکان‎ ]eve1)1(-1 ضع‎ (iii) 

(iv)‏ إذا كان الموقع ر+(1)ل يحتوي [1] عندها: ضع ر في (1)ءه1 


وإلا: ضع 1٣ل‏ في (1)ءه! 

2-3 من أجل 11 إلى N‏ نفذ على التوازي: 
[ المعالج :م في الابن اليميني يقرأ من والده وينتقل بعدها إلى أسفل الشجرة] 
إإا كان !0٥)1(‏ زوجي و 1)1(=۷عع] عندها: 
() اقرا محتويات ×+()ل 
(11) اكتب محتويات ×+(1)ل في الموقع (1)ء10+(:)J‏ 
(i)‏ ضع 1evel(i) jl leve1(1)-1‏ 
(۷]) إذا كان الموقع و+(1)ل يحتوي [1] عندها: ضع ل في (i)ءه!‏ 

وإلا: ضع 1+ ل في (1)ءه! 


Void MULTIPLE BROADCAST(d(1),d(2),..,d4(N)) 


Stepl: for =1 , i <= N , it) in parallel 
/ p; initializes level(i) and loci) 


{ 

1.1 level(1) +— 0 

1.2 loc(i) + NFi-2 

1.3 store [i] in location d()Floc(i) 


} 
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Step2: for (v=O0 „, v <= (log N)-2 , v+4+) 
{ 
(2.1) for (i=1 , i <= N , i+) in parallel 
/I pıat a left child advnces up its tree 
{ (2.1.0 x—|(oc(i)-172] 
(2.1.2) if (loc(î) is odd and level(i)=v) 
{ (i) loci) +~ x 
{iD store [i] in location d(i}tloc(i) 
(Hii) level(i) +- level) +1 


} 


1 

(2.2) for (=1 „i <= N , i++) in parallel 

/I pat a right child advances up its tree if possible 

if (d(i+x does not already contain a marker [j] for some 1I<jSN) 


(1) loc() + x 
(ii) store [i] in location d(i)tloc{i) 
(iii) level(i) +— level(i) +1 


} 
Step3: for (v= (log N )-1 , v>=0 , v=-) 


(3.1) for (=1 „1 = N , iH) in parallel 
/! pat a left child reads from its parent and then moves down the //tree 


{ 

G.1.1) x L(doc()-1)/2J 

(3.1.2) y~ (2 xloc(i)) + 1 

(3.1.3) if (loe() is edd and level(i)=v) 
{ 


(i) read the contents of di)+x 
(i) write the contents of d(i)+x in location d(i)+locG) 
(ii) level (i) «- level (i) — j 
(iv) if (location d(i)ty contains [i]) 
loci) ¢ y 
else 
loc) 4-y +1 
3 


ا 
for (i=] „i <= N , 1+) in parallel‏ )3.2( 
pat a right child reads from its parent and then moves down the //tree‏ / 


if (loc(i) is even and level()jZv) 
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{ : 
(v) read the contents of d(x 
(vi) write the contents of d{i)+x in location d(i)tloc(1) 
(vi) level (i) 4 level (1) — | 
(viiD if (location d(i)ty contains [i}) 

loc) « y 

else 
loc) ¢ y + 1 


} 

ئلاحظ أن الخطوة (1) في الإجراء تتألف من ثلاث عمليات ثابتة مع الزمن» إضافة إلى أن كل من 

المرحلتين الصاعدة (المتزايدة) والنازلة (المتتاقصة) في الخطوتين 2 و3 على التوالي تتطلب زمن 
N(‏ 0(0 ومنه فإن زمن ialفıذ‏ لاإجرIاء .O(log N) ya MULTIPLE BROADCAST‏ 


مثال(8-3): 


لتكن N=16‏ ولنفرض في لحظة معطاة خلال التتفيذ على معالجات خوارزمية متوازية C۸٤۷‏ أن 
المعالجات ۳6, 1,۳4 ۴4,۴,۳,د۴,د۴,,۴ تحتاج لقراءة كمية © من موقع ( في الذاكرة. 

عندما نحاكي عملية القراءة المتعددة هذ عل” اسب MULTIPLE مدخڌi EREW‏ 
B۴01‏ حيث تضع المعالجات طلباتها في مستويات معينة في شجرة مواقع .جذرها 5 
خلال الخطوة(1) كما نرى في الشكل 14-3 ء وتظهر المواضع للمعالجات المختلفة ومحتويات مواقع 
الذاكرة في نهاية الخطوة(2) في الشكل 14-3 » ومحتويات مواقع الذاكرة في نهاية الخطوة(3) تظهر 
في الشكل 15-3. 
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7 GL 1 J 


SY E EN E‏ لا ا e‏ ا 
OLIOIE COE LEE E OEE‏ 
P,‏ ڊP‏ 


الشكل (14-3) محتويات الذاكرة بعد الخطوة (2( في !لإجر MULTIPLE BROADCAST «I‏ 


الشكل (15-3) محتويات الذاكرة في نهاية الإجراء MULTIPLE BROADCAST‏ 
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سنعرض خوارزمية متوازية ومتكيفة وبكلفة أفضلية للدمج على النموذج 8EW $M S15‏ 8۸. تقوم 
الخوارزمية بدمج مئسلسلتين مرتبتين (يك,..,4:,82) = A‏ و إ,ار..ررط,ط)=8 في متسلسلة ثالثة: ° 
(مبم٥,..ر2٥,)‏ = مرتبة تصاعدياً. وتستخدم ۸ معالج: بر,..,طررط حيث: + > N‏ > 1 وفي أسوا 
الأحوال عندما: " = و = ۲ تتفذ الخوارزمية خلال زمن (۸” عه! × عها+(/م))0. ويتم ناء 
الخوارزمية عن طريق إجراء تسلسلي لإيجاد الأوسط في متسلسلتين مرتبتين. 


3- خوارزمية إيجاد العنصر الأوسط لمتسلسلتين مرتبتين: 


لیکن لدینا متسلسلتين مرتبتین (یھ,..,3,42) = ۸ھ و لہط,.۔ررطاررط)=8 حیث: 1 < ٣,۶‏ ولتکن A.8‏ 
متسلسلة طولها = m۳‏ تنتج من دمج ےھ و8 ۽ فيکون العنصر الأوسط هو 2 في ۰ وتعید 
هذه الخوارزمية زوج (رطب.ه) يحقق الخواص التالية: 


1- الاأوسط في ۸.8 هو إما ة أو رط حيث إما به أو رط أكبر تماماً من العناصر 1- 0/2 
وأصغر تماما من العناصر [2/”|. 

2 إا كان ج هو الأوسط عندها فإن رط يكون إما: 

(i)‏ أكبر عنصر في 8 أصغر أو يساوي هة 

(i)‏ أصغر عنصر في 8 أكبر أو يساوي به 


وبشكل مشابه: إذا كان رطا هو الأوسط عندها فإن به يكون إما: 


(iv)‏ أصغر عنصر في 4 أكبر أو يساوي رط 


3- إا كان هناك أكثر من زوج واحد يحقق 1 و 2 عندها فإن الخوارزمية تعيد الزوج الذي من 
أجله لإ + × هو الأصغر. 


سنرمز ب(رداي,8) للزوج الأوسط في 4.8 لذلك فإن × و رهما دليلا الزوج الأوسط. 


ونلاحظ أن 4 هو الأوسط في 4.8 إذا كان: 
a by, l4} (i)‏ و x+y-1=Î m/21-1‏ 
(ii)‏ و aq< by‏ و m-(xty-1)=lm/2|‏ 
ولا فن رط هو الأوسط في ۸.8 
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مٹال(9-3): 
لثكن [۸=)2,5,7,10 و [8=)1,4,8,9 » نلاحظ أن الأوسط في ۸.8 هو 5 وهو ينتمي إلى ۸. 
يوجد لدينا زوجين أوسطين يحتقان الخاصتين 1و2: 

* (5,4) = (دط,ره) حيث 4 هو أكبر عنصر في 8 أصغر أو يساوي 5 

* (5,8) = (وط,ره) حيث 8 هو أصغر عنصر في 8 أكبر أو يساوي 5 
لذلك فإن الزوج الأوسط هو (5,4). 
لدينا فيما يلي الإجراء ٣r٥w_ SEQUENCE MED1AN‏ الذي یتم في مراحل وبعد کل مرحلة 
تتقل في النهاية بعض العناصر من المناقشة من کل من ۸ و 8. 
سذرمز ب 1۸ و و1 لعدد العناصر في 4 و 8 على الئوالي التي مازالت قيد المناقشة في بداية كل 
مرحلة ول W‏ إلى الأصغر فیما ہین n2‏ ]و İnp/2l‏ 
وتتم كل مرحلة كالتالي: تتم مقارنة كل من الأوسط a‏ و ا من العناصر التي ما زالت قيد المناقشة في 
کل من 4 و 8 على التوالي › إذا كان طا < ه عندها تبعد العناصر الأكبر (الأصغر) في ۸ (8) عن 
المناقشة. من جهة أخرى فإنه إذا كان ط > ج فإن العناصر الأصغر (الأكبر) س في ۸ (8) تبعد عن 
المناقشة. تتكرر هذه العملية حتى يبقى عنصر واحد فقط قيد المناقشة في متسلسلة واحدة أو في 
الاثنتين. عندها يحدد الأوسط من مجموعة صغيرة من الأزواج المرشحة. 


يسلسل الإجراء هذه الأفكار عن العناصر التي ما زالت قيد المناقشة عن طريق استعمال مؤشرين لكل 
من المئسلساثين: IOWA shigha‏ في AÃ‏ و lowa ,„highp‏ في .B‏ 


: Tow_ SEQUENCE MED1IAN(A,B,xy) الإجراء‎ يمjراوخ‎ -4 
Void Tow_ SEQUENCE MEDIAN(A,B,x,y) 
Step1: (1.1) lowa+— 1 
(1.2) lowg ~1 


(1.3) high, ~r 
(1.4) highg < s 


125 


All1 Rishts Reserved - Library of University of Jordan - Center of Thesis Deposit 


(1.5) na ~r 
(1.6) ngs 
Step2: while (n>1) && (ng>1)) 
{ 
(2.1) u+— lowa+Î (higha- lowa -1)/2 | 
(2.2) v < lowg+Î (highs - lowp-1)/2 | 
(2.3) w+ min Û na/2J | ns/2J) 
(2.4) na —na—w 
2.5) ng —ngs—~w 
(2.6) if (a, > b,) 
{ (Dhigha + higha¬ w 


(ii) lowg += lowp + w 


} 
else 
{ (i) low, — lowa tw 
(i) highp + highg— w 
1 
1 
Step3: return as x and y the idices of the pair from {4-1341 }X {Dw 


10y, Dy, } satisfying properties 1-3 of median pair. 


نلاحظ أن الإجر اء« r٥w_ SEQUENCE MEDIAN‏ يعید أدلة الزوج الأوسط (رامa)‏ بدلا من 
الزو a‏ تقسه. 
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مثال(9-3): 
لتكن [۸=)2,5,7,10 و إ8=)1,4,8,9 ١‏ نلاحظ أن الأوسط في ۸.8 هو 5 وهو ينتمي إلى ۸. 
يوجد لدينا زوجين أوسطين يحتقان الخاصتين 1و2: 
" (5,4) = (ط,ده) حيث 4 هو أكبر عنصر في 8 أصغر أو يساوي 5 
* (5,8) = (وطا,رة) حيث 8 هو أصغر عنصر في 8 أكبر أو يساوي 5 
لذلك فإن الزوج الأوسط هو (5,4). 
لدينا فيما يلي الإجراء ۲٥w_ SEQUENCE MEDIAN‏ الذي يتم في مراحل وبعد كل مرحلة 
تنقل في النهاية بعض العناصر من المناقشة من كل من ۸ و 8. 
سنرمز ب ٣۸‏ و و٠‏ لعدد العناصر في 4 و 8 على التوالي التي مازالت قيد المناقشة في بداية كل 
مرحلة وب ۷ إلى الأصغر فيما بين 2/ي أو /2/وط). 
وتتم كل مرحلة كالتالي: تتم مقارنة كل من الأوسط هج و ا من العناصر التي ما زالت قيد المناقشة في 
کل من 4۸ و 8 على التوالي › إذا كان طا < ۾ عندها تبعد العناصر الأكبر (الأصغر) في 4 (8) عن 
المناقشة. من جهة أخرى فإنه إذا كان طا > 4 فإن العناصر الأصغر (الأكبر) س في ۸ (8) تبعد عن 
المناقشة. تتكرر هذه العملية حتى يبقى عنصر واحد فقط قيد المناقشة في متسلسلة واحدة أو في 
الاثنتين. عندها يحدد الأوسط من مجموعة صغيرة من الأزواج المرشحة. 
يسلسل الإجراء هذه الأفكار عن العناصر التي ما زالت قيد المناقشة عن طريق استعمال مؤشرين لكل 
من المتسلسلتین: ر ۲عنط, رسها في ۸ و وطعنط, وسا في 8 . 
4¬“ خوارزمي الإجرlء‏ )x,yڀ,MED1IAN(A,B Tow_ SEQUENCE‏ : 
Void Tow_ SEQUENCE MEDIAN(A,B,x,y)‏ 
Stepl: (1.D lowa—1‏ 
lowp ~1‏ )1.2( 
high, ~r‏ )1.3( 
highs — s‏ )1.4( 
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5“ تحليل خوارزميa‏ الإجراء+ :Tow_ SEQUENCE MED1AN‏ 
تأخذ الخطوتين 1 و 3 زمناً ثابتاً. كل تكرار في الخطوة 2 يجعل الأصغر من المتسلسلتين إلى 
النصف. من أجل الثوابت رع,رء فإن الإجراء ۲0٥w_ SEQUENCE MEDIAN‏ یتطلب زمن قدرہ 

)min),5((‏ ع0ا دe+,ء‏ والذي هو (” ع0)10 في أسوأً الأحوال. 
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يصعب في بعض الأحيان كتابة خاتمة للأبحاث العلمية ولبعض الأبحاث 
النظرية التي تلخص أهم نتائج تلك الأبحاث. ونظرا لأن الرسالة تتدرج ضمن 
الفئتين السابقتين فقد رأينا أنه من المفيد أن نختتم هذا العمل ببعض الملاحظات 


والنتائج والمقترحات. 


* إن دراسة الخوارزميات المتوازية هذا الفرع الجديد من فروع المعلوماتية 
مسألة صعبة في وقتنا الراهن وخصوصا لعدم توفر أجهزة ملائمة تسمح 
بترجمة الخوارزميات المقدمة في هذه الرسالة إلى برامج عملية نتحقق مسن 
خلال تطبيقها على مسائل واقعية من أهمية النتائج التي يمكن أن نتوصل 
إليها. 

* بيا في الفصل الأول من الرسالة مفهوم الأنظمة متعددة المعالجات وتعريفها 
وتصنيفها ودراسة أسلوب التواصل فيها » كما قدمنا أفكاراً ونكائج تشكل 
أساسات نظرية الحساب المتوازي و وضحنا بععمض نماذج الحساب 
المتوازي. 

" درسنا في الفصل الثاني الخوارزميات المتوازية وأنواعها وميزنا خواصها 
وتقنيات تصميمها ومقاييس تحليلها وتحديد كفاءتها. 

" قدمنا في الفصل الثالث مسائل هامة وخوارزميات حلها بشكل متوازي وذلك 
بالاعتماد على أجهزة متعددة المعالجات › ووجدنا أننا نستطيع باستخدام 
الخوارزميات المتوازية زيادة حجم المسائل الممكن حلها كمسا تساعد 
الخوارزميات المتوازية في الحصول على معلومات أكثر وحلول أفضل 
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بتقليل الكلفة للمسائل كما وجدنا ضرورة تخصيص المعالجات بحجم كبير من 
العمل لاسثثمار الحواسيب المثوازية بشكل أفضل. 

تسمح المسائل التي تمت معاجتها في هذا الفصل في توضيح أثر الموازاة في 
زيادة حجم المسائل التي يمكن حلها وتقليل زمن الوصول إلى الحل الأمثل إذ 
أن استخدام خوارزمية التحقق من الانتهاء يخبر بوصول مبكر للحل وبالتالي 
يؤدي إلى تقليل زمن التنفيذ. 


المقترحات والتوصيات: 

عندما يقرر أحد الباحثين معالجة مشكلة أو إجراء بحث علمي يكتشف في نهاية 
المطاف أنه مهما توسع في بحثه وحاول تخطية كافة جوانبه ومعالجتها تبقى 
بعض المسائل التي لم يمكن من معالجتها أو أنها ظهرت في سياق البحث 
وأصبحت خارج حدود المسار الذي رسمه لنفسه الأمر الذي يدفع بالباحث إلى 
تقديم مجموعة من المقترحات والتوصيات لتكون مدخلا لأبحاث جديدة أو دعوة 
إلى الباحثين في المضمار نفسه لمعالجتها وإيجاد حلول لها. ومن هذا المنطلق 
أرى ضرورة تقديم بعض المقترحات والتوصيات: 


# أقترح إجراء دراسة عامة وموسعة لكافة المسائل بالأسلوب المتوازي 
وفهم طرائق التعامل مع الأجهزة المتوازية وشبكات اتصالها لتحديسد 
الخوارزميات المناسبة لحل المسائل. 

# تبين لنا أن المسألة الملحة الواجب معالجتها من وجهة نظر البرمجيات 
تكمن في تخصيص المهمات أو العمليات للمعالجات وتطرح هذه المسألة 
نفسها في الأجهزة المتعددة المعالجات ولابد من إجراء دراسات متعمقة 
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في هذا المجال حتى نحصل على أفضل النتائج المأمولة من الموازاة في 
البرمجة. 

# أقترح الاستفادة من مفاهيم وخواص الخوارزميات المتوازية لوضسع 
خوارزميات جديدة أو تطوير الخوارزميات القديمة لحل المسائل التي لا 
خرف خاد غاا لها اة لكر المساق وغ ها 

# أرى أن مشكلة نقل المعلومات التي ظهرت في مسألة البحسث الشجري 
وتظهر في العديد من المسائل المشابهة ستبقى لمسدة طويلة موضوع 
الساعة ومن المناسب التعمق في دراستها والبحث عن خوارزميات تسمح 
بمعالجتها وتعديلها وتطويرها. 


نتبين من كل ما تقدم بأن الخوارزميات المتوازية هي فرع جديد وهام من فروع 
المعلوماتية » كما أنها تفتح الأبواب على مصراعيها أمام الباحثين المهتمين في 
هذا المجال وإني أدعو كافة الباحثين والمهتمين لمتابعة البحث سواء في المجال 
النظري أو في المجال العلمي لأني أعتقد بن هذا الفرع من فروع المعلوماتية 
سيبقى لوقت طويل موضوع الساعة ومحور اهتمام كافة المختصين والباحثن. 
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الفعالة 
محدود أو مقصور 
الوثوقية 
قاعدية 
عقد الدخل 

قوف اة 
الحدود الدنيا والعليا 


Account of cost 
Adaptive 
Bit complexity 
Broadcasting 
Chips 
Circuit width 
Concurrent 
Constant nodes 
Compilers 
Counting Steps 
Cube Connection 
Depth 
Deterministic 
Efficiency 
Exclusive 
Feasibility 
Imperative 
Input nodes 
Interpretation 
Linear Arraay 


Lower and upper bounds 
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Multiple Instruction stream, Multiple Data stream (MIMD) 
حواسيب ۱|10 (سلسلة تعليمات متعددة - سلسلة بياتات متعددة)‎ 
Multiple Instruction stream, Single Data stream (MISD) 
حواسيب 150 (سلسلة تعليمات متعددة - سلسلة بيانات مفردة)‎ 


تعددية المهام Multitasking,‏ 
عقد عملیات Operation nodes‏ 
عقد الخرج Output nodes‏ 

Parallel time زمن التوازي‎ 
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Partial ordering graplı بيان الترتيب الجزئي‎ 


Perfect shffle connection الاتصالات المختلطة التامة‎ 
Period of the circuit مهلة الدارة‎ 
Prefix sums المجأميع البادئة‎ 

Processor area مجال المعالج‎ 
Quality نوعية‎ 
Shared memory ذاكرة مشتركة‎ 


Single Instruction stream, Multiple Data stream (MIMD) 
حواسيب 5|10 (سلسلة تعليمات مفردة - سلسلة بيانات متعددة)‎ 
Single Instruction stream, Single Data stream(S1SD) 
حواسيب 51582 ( سلسلة تعليمات مفردة» سلسلة بيانات مفردة)‎ 


زيادة السرعة Speed up‏ 
معالجات خطية String processors‏ 
ذاكرة مشتركة مقسمة إلى مقاطع R-block shared memory‏ 
المضاعفة التعاودية Recursive doubling‏ 
تخفيض عدد المعالجات Reducing the number of processor‏ 
خطوات الإضطراب أو الدوران Routing steps‏ 
زمن النتفيذ Running time‏ 
مصفوفة ثائية البعد Tow-Dimensional Array‏ 
شجرة الاتصال Tree Conection‏ 
تكرارات المتجهأات Vector iterations‏ 
طريقة استخدام المتجه Vectorization‏ 
الآلات الشعاعية Vector machines‏ 
مقياس الضم الكبير جداً Very large scale integration (VLSI)‏ 
طول السلك Wire length‏ 
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قائمة الأشكال والجداول: 


رقم الشكل الدلالة 


رقم الصفحة 


يبين دارة منطقية بسيطة تعتمد على القاعدة القانونية فيها 
Z(a)=15‏ ڪ D(a)=6‏ 


بيان حسابي من أجل حساب تسلسلي ل × بدرجة تعقيد 
لوغاريتمية 


Ai; Fa; 
شبكة تطوير خاصة للمضاعفة التعاودية‎ 
حساأب المجاميع البادئة على شجرة المعالجات‎ 
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١888 يوضح حساب المجاميع البادئة باستعمال الإجراء‎ e 
PREFIX SUMS 

104 PARALLEL SELECT ءlرجإl‎ Jae ıJ | 8-3 | 

|93 __إيوضح دخل وخرج المعالج مقار |103 


| 10-3 | يوضح شبكة خاصة لدمج متسلسلتين ثائيتين 104 


| 13 | شیک س من جل حم ملین و | 


7-3 
8-3 
9-3 
ا إعا س ا 
ESEF TIKE‏ 
14-3 | محتويات الذاكرة بعد الخطوة (2) في الإجراء 
MULTIPLE BROADCAST‏ 


2 
15-3 | محتويات الذاكرة في نهاية الإجراء MUL 11۴1٤‏ 122 
BROADCAST‏ 


يوضح التمثيل الثنائي لقيم أدلة المعالجات المتجاورة في 
شبكة اتصالات تكعيبية حيث 3= و NN=8‏ 
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الخوارزميات المتوازية " الدكتورة ميساء بدر حمشو - ]M8.3[‏ -23 
8 - ”والخوارزميات الموزعة وتطبيقاتها في بحو العمليات 
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ملخص عن دراسة أعدت لنيل درجة الماجستير في المعلوماتية 
بعنوان: (خوارزهيات المعالجة المتوازية وبرمجتها) 
إعداد الطالبة كندة زين العابدين 
بإشراف الأستاذ الدكتور خالد علي الخنيفس 
ومشاركة الدكتور حامد خالد الرجوب 


تعريف تعددية المهام: 


هي قدرة نظام التشغيل على تتفيذ أكثر من مهمة واحدة في الوقت نفسه » وتبنى الخوارزمية في 
الأجهزة المتعددة المعالجات على أساس تعددية المهام والتتفيذ المتزامن وتعتمد البرمجة المتعددة 
المهام على فهم طريقة نتفيذ التعليمات على البيانات حيث إن هناك سلسلة من التعليمات (الخوارزمية) 
تأمر الحاسب بوظيفته في كل خطوة وهناك سلسلة من البيانات (دخل الخوارزمية) سستتأثر بلك 
التعليمأت. 
[5064-1989] نستطيع أن نميز بين أريعة أنواع من الحو اسيب: 
1- أولا: حواسيب 8180 ( سلسلة تعليمات مفردةء سلسلة بيانات مفردة) 
Single Instruction stream, Single Data stream (SISD)‏ 
2- ثانياً: حواسيب 1180 (سلسلة تعليمات متعددة - سلسلة بيانات مفردة) 
Multiple Instruction stream, Single Data stream (MISD)‏ 
3- ثالثا: حواسيب 5110 (سلسلة تعليمات مفردة - سلسلة بيانات متعددة) 
Single Instruction stream, Multiple Data stream (SIMD)‏ 
4~ حواسيب 10|( (سلسلة تعليمات متعددة - سلسلة بيانات متعددة) 
Multiple Instruction stream, Multiple Data stream (MIMD)‏ 
في معظم المسائل الهامة التي نحلها بأستخدام حواسيب من النوع 8112 من المستحب أن تكسون 
المعالجات قادرة على الاتصال مع بعضها خلال الحساب من أجل تغيير البيانات أو النتائج المكررة. 
ونحقق هذا الاتصال وفقاً لفئتين فرعيتين: إحداهما يتم الاتصال فيها عن طريق الذاكرة المشتركة 
والأخرى عن طريق شبكة الاتصالات. 
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حواسیب S115‏ )51( بذاڪر ة5 مشتركû Shared-Memory‏ : 
]806G4-1989[‏ تعرف هذه الفثة أيضاً بآلسة الوصول العشواثي المتوازي نموذج )٥۸۸0(‏ 
(the Parallel Random-Access Machine)‏ 

عندما يريد معالجان الاتصال فإنهما يعملان خلال الذاكرة المشتركة ء ويمكن أن نقسم فئة الحواسيب هذه 
إلى أربع فئات فرعية وفقا لقدرة اثنين أو أكثر من المعالجات على الوصول إلى موقع الذاكرة نفسه وبنفس 
الوقت وذلك كما يلي: 


1- Exclusive-Read, Exclusive- Write (EREW) SM SIMD Computers. 

2- Concurrent-Read, Exclusive-Write (CREW) SM SIMD Computers. 
3- Exclusive-Read, Concurrent-Write (ERCW) SM SIMD Computers. 
4 Concurrent-Read, Concurrent-Write (CRCW) SM SIMD Computers. 


حواسیب S[M5‏ شبکة اتصالات: 


[64-1989ء5] يمكننا الحصول على نموذج مرن أكثر قوة من نموذج الذاكرة المشتركة يكون فيه 
كل زوج من المعالجات متصل بخط ثثنائي الاتجاه » حيث يمكن لعدة أزوج أن تتصل بآن واحد (ولكن 
بشرط ألا يحاول أكثر من معالج إرسال البيانات إلى معالج آخر أو تلقي البيانات من معالج آخر). 


الشبكات البسيطة لحواسيب :S]M[0‏ 


سنلخص بإيجاز الشبكات الأكثر شيوعاً منها فيما يلي: 

:Linear Array مصفوف خطية‎ -[1 

يمكن تمثيل وصل N‏ معالج بشكل مصفوفة وحيدة البعد كما يظهر في الشكل (1-1) من أجل 6=. 
هنا المعالج ۴٢‏ مرتبط بمجاوریه .ز۴ و ۴ من خلال خط اتصال ثنائي الاتجاه. كل من معالجسات 
النهاية والمسماة ,۶ و بر۴ تملك فقط مجاور واحد. 


شكل (1-1) شبكة خطية من أجل ١=6‏ 
2- مصفوفة ٹنائيA‏ بد :Tow-Dimensional Array‏ 
نحصل على شبكة ثناتية البعد بترتيب ال × معالج في مصفوفة ×" حيث ”×= " كما يظهر 
الشكل(2-1) من أجل 4=" 
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شكل2-1 شبكة اتصالات بمصفوفة ثنائية البعد (شبكية) 
من أجل 4= 


3- شجر ة الٺٿتصJi :Tree Connection‏ 
تکكرن المعالجات في هذه الشبكة بشكل شجرة ثثنائية تامة ومثل هذه الشجرة ثملك ل مستوى كما يظهر 
الشكل (1-3) من أجل 4=ل. 


المستويى3 


المستوي2 


3H 


شكل (3-1) شبكة اتصالات شجرية من أجل 4=4 
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4- الاتصالات المختلطة التَامة :Perfect shuffle con necti07‏ 
ليكن لدينا × معالج .»۴,..,د,:۴رم۴ متوفرة حيث × هي قوةل 2 )N=2(:‏ 
يوجد في الاتصالات المختلطة التامة خط وحيد الاتجاہ یربط ;۴ ب ز۴ حيث: 
<=1<=—N/2 -1,‏ 0 من أجل 2i‏ 


N/2 <1<=N-l ,‏ من أجل 2i+1-N‏ 
كما يُظهر الشكل(4-1) من أجل ١×=8‏ 


Bı a ا‎ 5 8 1 


شكل (4-1) شبكة اتصالات مختلطة تامة من أجل 8= 


:Cube Connection ûيبعkكتل الاتصالات‎ 5 

لنفترض أن N=21‏ من أجل بعض 1< ولتكن ال N‏ معالج: ر۔ہ۴,..,د ۴,۴,۳ مكعب من 4 بعد 
أو (#طuاpeرhا)‏ نحصل عليه بوصل كل معالج إلى ¶ مجاور. 

ونرى شكل الشبكة فيما يلي من أجل 3= والفهرس ل”م,..,,مص موضحا بشكل رموز ثنائية. 


شكل 5-1 شبكة اتصالات تكعيبية من أجل ١=8‏ 
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نظريات الحساب المثوازي: 


[1994,س@[M]‏ تعرأف نظريات الحساب المتوازي أن المكان والزمان هما المصدران الأساسيان 
الأكثر أهمية المعرفان لتعقيد الحساب التسلسلي. وفي الحساب المتوازي تبقى أهمية الزمن نفسها: حيث 
أن السبب الرئيسي لدراسة الحساب المتوازي هو للحصول على زيادة سرعة حل المسائل الحسابية 
صن عص » وإذا توفر لدينا وحدات معالجة أكثر فإن الزمن المطلوب لحل مسألة معطاة ينخفض» 
وهذه الحقيقة تجعل وحدات المعالجة هي المتطلب الرئيسي الثاني في الحساب المتوازي. 


الحسابات المتوازية والنماذج اللوغاريتمية: 


تعريف النموذج اللوغاريتمي: 
][M[0»,1994[‏ يمكن وصفه بالحقائق التالية: 
5“ یمكن أن يستعسمل أي عدد من المعالجات في أي لحظة. 
6- يمكن أن ينفذ كل معالج أي تعليمة (رياضية أو منطقية) في وحدة زمن. 
7- لا يوجد كلفة من أجل الوصول للبيانات. 
8- لا يوجد كلفة للاتصال بين المعالجات. 


أُما المصادر الأساسية المطلوبة من النموذج فهي عدد الخطوات المتوازية (عدد وحدات الزمن) وعدد 
المعالجات المستعملة كدالة في حجم المسألة. 


الدارات المنطقية: 


]M[0Q,1994[ , ][[4[,1992[‏ إن الحواسيب الاعتيادية هي آلات متوازية كما أن كل حاسب 
مصنوع من دارات الكترونية تحوي الملايين من العناصر المفتاحية وخطوط النقل كلها تعمسل على 
التوازي ٠‏ والدارات المنطقية هي نموذج منطقي من الدارات الالكترونية. يعمل هذا النمسوذج على 
مسائل تمثل بسلسلة من الخانات › تحول جميع المعلومات الداخلة والخارجة من حاسب حقيقي إلسى 
رموز في سلسلة من الخانات الثنائيةء ومع بعض الترتيب في البنية تصيح دالة على بيانات » بمعنى أن 
السلسلة تعتمد على التفسير (الترجمة) ١0اهاء٣مإع1٠.‏ وبما أن تنفيذ العمليات يتم في مستوى الخانة 
فإنه عندما نعبر عن خوارزمية بدارة منطقية فإن كلفتها تدعى [ كلفة الخانة اوه زط] بينما يسدعى 
تعقيدها [ تعقيد الخانة راأ×عأمهء ا1ط] وهي تعد مقياسا لكلفة التوازي. إن الخصاأئص السابقة تجعل 
تموذج الدارة المنطقية قاعدة لدراسة تعقيد الحسابات المتوازية. 
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تعريف الخوارزمية المتوازية: 


تعرف الخوارزمية المتوازية بأنها مجموعة من العمليات التي تتجز كل منها خوارزمية تتابعية خاصة 
بها وتتبادل الاتصالات فيما بيتها عبر شبكة اتصالات محددة. 

وهي تتبع بشكل أساسي للنماذج الرياضية الأساسية في الحاسوب المتوازي والتي قمنا بتعريفها في 
الفصل الأول وتتمايز أنواعها حسب أنواع الحواسيب المتوازية. 


تحليل الخوارزميات المتوازية: 


]An[e-1974[ , ]6SA6-1994[‏ , [6G4-1989ءS]‏ يحدد تحليل الخوارزميات المتوازية درجة 
جودة الخوارزمية وهذا يعني سرعتها وكلفة تتفيذها ومدى فعاليتها عند استعمالها في الوسائل المتاحة. 
ولذلك فإننا نهتم بالمعايير التالبة: زمن التنفيذ وعدد المعالجات المستخدمة ومن ثم نقوم بحساب الكلفة. 
أولا: زمن التنفıڈ Running time‏ 00۹ 
هو الزمن الذي تأخذه الخوارزمية خلال حل المسألة على حاسب متوازي. وذلك يعني أنه الزمن 
المستهلك من الخوارزمية مئذ اللحظة التي بدأ فيها إلى اللحظة التي نتتهي فيها. 
ثانياً: عدد المعالجات 
المعيار الثاني الأهم في تقييم الخوارزمية المتوازية هو عدد المعالجات المطلوبة في حل مسألة. حيث 
أنها مكلفة من أجل الشراء والصيانة وتشغيل الحواسيب. 
ثالثا: حساب الكلفة ACCOUNT OF COST‏ 
تعرف كلفة خوارزمية التوازي على أنها حاصل ضرب المعيارين السابقين: 

الكلفة “= زمن التنفيذ × عدد المعالجات المستخدمة 
إذا الكلفة تساوي عدد الخطوات المثفذة بشكل جماعي من قبل المعالجات في حل مسألة بأسوأً حالة. 
يفترض التعريف أن جميع المعالجات ننفذ نفس عدد الخطوات. وإذا لم تكن الحالة كذلك فإن الكلفة هي 
الحد الأعلى في ناتج عدد الخطوات المنفذة. 


تصميم الخوارزميات المتوازية: 
]JeHk-1997[ , ]BrCMa1-1992[ , ]JHKi-1990[‏ , [۴0-1994]] نبداً بتطویر الخوارزمیات 
المتوازية من الخوارزمية التسلسلية ومن ثم نحدد الخطوات المستقلة وأخيراً نحصل على الغوارزمية 


المتوازبة. وهذا التحول من التسلسل إلى التوازي ينتج غالبا خوارزميات متوازية ذات كلفة تخفطضدة. 
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ومن أجل ذلك تنشأً مسالة تحديد استرائيجيات الحصول على خوارزميات مثوازية فعا حيث لأ يوجد 
طريقة عامة تعطي أفضل خوارزمية متوازية لمسألة معطاة ولكن هناك تقانات تستعمل لهذا الغفرض 
وسنعرض بعض هذه الطرائق و النقانأات: 


6. التقسيم والتخصيص r4ءp :Divide et im‏ 
تعتمد هذه لتقائة على تقسيم المسالة إلى مسائل جزئية من نفس النوع ولكن بحجم أصغر ومن شم 
إعادة ترتيب وتجميع الحلول. وهي طريقة فعالة جدا حيث تسمح بتجزئة المسألة إلى مسائل جزئية 

مستقلة تحل على التوازي وتجمع حلولها للحصول على حل المسألة الأصلية. 

7. طريقة استخدام المتجه 101) :Vect0 ۲1z‏ 
تبداً هذه التقانة من تحليل المسألة وإنتاج الخوارزميات التي تعمل على بنى المعطيات التي تتتاسب 
مع حسابات المتجه (المتجهات والمصفوفات). 

8. تکرارات المتجlkٽ :vector iterations‏ 
قام بوضع هذه التقانة ا۲۲۵ وآخرون من أجل حل الجمل الخطية المثلثية. حيث تبداً باستخدام 
الخوارزميات التسلسلية المباشرة وتبنى منها الطريقة التكرارية المتوازية وهكذا.. 

9. المضاعفة lنتعودية :Recursive doubling‏ 
وهي تتثألف من تحويل البيان الحسابي من مثل البيان المعروض في الشكل (1-2 -أ-) إلى بيان 
من الشكل(1-2 حبح) وهذا يمكننا من الحصول على بيان تكون فيه كلفة التجوال (درجة التعقيد) 
تابع أسي (لوغاريتمي) من بيان فيه كلفة التجوال (درجة التعقيد) تابع خطي. 


O 
ا‎ 4 3: 
ا ا‎ 
0 ۹ َ ا ۹ و م‎ ° 
2x 
8 
O O 
الشكل(1-2) -أ- بيان بدرجة تعقيد خطية الشكل(1-2) حب- بيان بدرجة تعقيد لوغاريتمية‎ 
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18. نتخفيض غد المعالجات 10¢¢5¢0rض ‘Reducing the number 0f‏ 
حيث يمكن في بعض الأحيان إنقاص عدد المعالجات الكبير باستعمال خوارزمية متوازية وذلك بزيادة 
زمن النتفيذ بواسطة عامل ثابت. 


كفاءة خوارزمية: 


]"LP-1993[ , ]JHr0-1997[‏ , [&493] نعرف كفاءة أو كلفة خوارزمية بأنها ناتج ضرب 
عدد المعالجات التي تستعمل لإنجاز العملية وزمن التتفيذ للعملية. إن كلفة حل الجمل الكبيرة من 
المعادلات الخطية على الحاسب كبيرة ولمعرفة كيفية حساب الكلفة لخوارزمية ما لها كود معطى نقوم 
بعد عمليات الضرب والقسمة (العمليات الطويلة) لأن لها أكبر زمن مستهلكء وبعد ذلك نجمّع عمليات 
الضرب والقسمة معا حتى ولو كانت عمليات القسمة أبطاً من عمليات الضرب. 


مقارنة بين الخوارزميات التسلسلية والمتوازية: 


[1997-)3[] , [۸2-1993هR]‏ يفيد تحليل الخوارزميات في مقارنة خوارزميات حل مسألة معيذة 
فما نريد الوصول إليه هو ما يلي: مهما تكن الآلة التي سثتفذ الخوارزمية ومهما نكن لغة البرمجة 
المستخدمة فإن: لنفرض أن لدينا خوارزميتين A‏ و 8 تتفذان المهمة البرمجية نفسها فإن الخوارزمية 
۸ أفضل من الخوارزميۂ 8. 


خوارزمية التحقق من الانتهاء من التوزيع (خوارزمية النشر): 

قد نحتاج أحياناً إلى نشر عنصر بيانات ما على جميع المعالجات في الحاسب المتوازي من أجل 
استعماله من قبلها جميعاً في الوقت نفسه خلال تنفيذ الخوارزمية. وهذه حالة خاصة من عملية القراءة 
المتعددة العامة. ومن الواضح أن المحاكاة الفعالة لهذه العملية لا يمكن إنجازها في خطوة واحدة على 
نموذج ۸٤W‏ ونحتاج من أجل تلك المحاكاة إلى وضع إجراء ينفذ هذه المهمة. وقد قمنا بشرح هذه 
العملية بالإڃجر اء .8R0⁄^۸DCAST‏ 

خوارزمية مراقبة الانتهاء: 

قد نحتاج أحياناً إلى معرفة ما إذا أنهت هذه المعالجات مهمتها أم لا ويتم ذلك كما يلي: 

لنأخذ موقع ؟ › يحتوي هذا الموقع على قيمة منطقية تحدد فيما إذا أتم أحد المعالجات المهمة المطلوبة 
وبالتالي تنهي باقي المعالجات عملها. في بداية الأمر تأخذ ؟ القيمة ع[ وعندما ينهي المعالج مهمته 
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فإنه يضع في ٤‏ القيمة عن » وفي كل خطوة نقوم جميع المعالجات بفحص قيمة ۴ فإذا كانت ع٣ا‏ 
نتوقف عن العمل . 

في حالة الحواسيب من التموذج 8۸٤EW‏ نلاحظ أن هذه العملية تحتاج إلى × عه!1 خطوة لنشر قيمة ؟ 
في كل مرة تحتاج إليها المعالجات وهذا يزيد زمن التفيذ. أما في نموذج الحواىسيب C۸٤۷‏ فإن 
عمليات القراءة المتعددة مسموحة وبالتالي تأخذ خطوة واحدة لجميع المعالجات من أجل الحصول على 
قيمة ۴ مما يخفض من زمن التتفيذ. كما نلاحظ أنه ريما ينهي أحياناً أكثر من معالج مهمته فسي آن 
واحد فيحتاج عندئذ أكثر من معالج إبلاغ النجاح في الوقت نفسه وهذا يعني أن اثنين أو أكثر مسن 
المعالجات ستحاول الكثابة في الموقع ۴ في الوقت ذاته وهذه العملية ممكنة فسي نموذج الحواسيب 
CRCW SM SIMD‏ فقط. 


خوارزمية سبر التفرع الشجري: 


]6٥.0,1993[, ]KM[m,1982[ , ]CS3[,1981[‏ يعتبر البحث أحد العمليات الشائعة في 
مجال الحسابات. ويستخدم في التطبيقات التي نحتاج فيها لمعرفة فيما إذا كان عنصر ما ينتمي إلى 
قائمة أو بشكل أعم تكرار في معلومات حقل مرتبطة بذلك العنصر. 

تتوضح مسألة البحث بشكل قاعدة عامة كما يلي: 

تعطى متسلسلة لم5=)5,,52,.........5 من الأعداد الصحيحة وعدد صحيح × والمطلوب تحديد فيما 
إذا كان م5 = × حيث »5 عنصر من 5. تحل هذه المسألة في الحسابات التسلسلية بمسح المتسلسلة 5 
ومقارنة العنصر × مع عناصرها المحددة وتستمر هذه العملية حتى نجد عنصراً صحيحاً مساوياً ل× 
أو تعود العملية بالفشل. 

لنفترض الآن أن لدينا حاسب 51۸0 باتصال شجري مع ١‏ مستوى من أجل البحث في ملف فيه ٠‏ 
سجل. مثل الشجرة المبينة في الشكل من أجل .٠=16‏ 

تخثلف مهام المعالجات في هذا النموذج حسب توضعها في الشجرة : 

تخزن كل ورقة في الشجرة سجل واحد للملف الذي نبحث فيه. 

- يلقى الجذر الإدخال من العالم الخارجي ومن ثم يمرر نائج الخرج الذي يتلقاه من أبنائه إلى 
العالم الخارجي» وبالعكس يتلقى الخرج من أبنائه ويصدره إلى العالم الخارجي. 

- لما من أجل العقد الوسطى فكل منها يستطيع القيام بما يلي: 


1. تتلقى العقدة الوسطى إدخالاً واحداً من الخلف (الأب) ويصنع منه نسختين يرسل 
2 يثلقى إدخالين من ابنيه يقارنهما ويرسل النتيجة إلى والده. 
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دخل /خرج | 


عقدة وسطية 


i U 


/الشكل (2-3)/ اأبحث على حاسب بائصال شجري 


تطبيقات الخوارزميات المتوازية: 


سنعرض الآن بعض تطبيقات مسائل القرار والأمثظية التي نستخدم فيها خوارزميات متوازية فعالة مثل 
خوارزمية حساب المجاميع البادئة لسلسلة وقد اخثرنا مسألتين هما: 

مسألة الأعمال التسلسلية وفق فترات لنتهائها (sع"1ا‏ لعل طاwi‏ عsequencin‏ bەز)‏ وهي مسألة 
قرار و مسألة حقيبة الظهر (”ءاطهإم kعدومه"))‏ وهي مسألة حل أمثل. 

لدينا في كل من المسألتين خوارزمية تعمل على حاسب متوازي باتصال شجري » علماً أن الخطوة 
الأساسية في كل من الخوارزميئين هي حساب المجاميع البادئة لسلسلةء وقد تم عرض عدة 
خوارزميات لمسألة حساب المجاميع البادئة من أجل عدة أنواع من الحواسيب. 

1“ خوارزمية الإجراء : (8, 3EQE N11A1L S708)‏ من أجل الحالة التسلسلية. 

2- خوارزمية الإجراء : PARA L_1_EÊL $SUMS),8S(‏ من أجل حاسب متعدد المعالجات. 

3“ خوارزمية الإجراء (جه,..,ر5)2,2 ۸150M‏ من أجل حساب جميع المجاميع. 

4- خوارزمية المجاميع البادئة على شجرة. 

5 المجاميع البادئة على الشبكة إءع. 
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مسألة الأعمال المثسلسلة وفق فثرات اننهائها : 


ايكن لدينا مجموعة من الأعمال نريد تتفيذها على آلة واحدة وليكن عددها ١‏ ولنرمز لها بالشكل الثالي: 
.لهل = [ . يمكن للألة أن تنفذ عملا واحداً في زمن ما وعندما تحدد عملا فيجب عليها أن 
تكمله قبل أن تبدأ بمعالجة العمل التالي. 
يرتبط بکل عمل زما يلي: 
3~ زمن معالجة زا . 

4“ مدة انتهاء :ل يجب أن يكتمل العمل من خلالها. 

نعرف جدول الأعمال بأنه تبديل الأعمال في [ الذي يحدد ترتيب تتفيذهاء ويقال عن الجدول أنه 
مناسب أو عملي إذا كان كل عمل ينتهي بمدة انتهائه . 

والمطلوب آنه إذا كان لدينا ١‏ عمل لبر ل..وريمل) لها أزمنة المعالجة [رمأر..وارم) ولها فترات 
الانتهاء [رمف,..,ل,مل) فهل يوجد جدول عملي لهذه الأعمال . 

يمکن الإجابة عن هذا السؤال بالإيجاب إذا وفقط إذا كان أي جدول أعمال تنفذ فيه الأعمال بترتيب 

متزايد لفترات الانتهاء عمليا. لذلك يكفي لحل المسألة إيجاد جدول أعمال ترب فيه الأعمال بترثيب 

متزايد لفترات الانتهاء وفحص فيما إذا كان هذا الجدول عملياً أم لا وفي حال تم ذلك فإن الإجابة عن 
السؤال تكون نعم و إلا فالإجابة لاء 

تحتاج هذه الخوارزمية لكلفة زمنية (” ع٠1 0)١‏ لترتيب الأعمال بشكل تسلسلي ومن ثم إلى كلفة 

زمنية («)0 لاختبار فيما إذا كان كل عمل يمكن أن يتم في فترة انتهائه. 


:THE KNAPSACK PROBLEM مسألة حقيبa ئظۈر‎ 


]M۴1,1981[ [WShi,1979] „, [DFGP,1982}‏ في هذه المسألة تتميز حقيبة الظهر 
بأنها تستطيع حمل وزن أعظمي ۷ ومجموعة من ١‏ مادة ولتكن: [رم41,..,3,م3 )=۸ والتي أوزانها 
على التوالي: WW.‏ كما يرئبط بكل مادة فائدة ونرمز لمجموعة الفوائد ب: 
c{PosP15--Pn-1}‏ إا وضعنا في حقيبة الظهر الجزء ;< من المادة التي وزنها س حيث 1 ك ;< > 0 
عندئذ فان الفائدة المكتسبة هي :ص2 . والمطلوب في هذه المسألة هو تعبئة حقيبة الظهر بالمواد و 
بأاجزاء منها بحيث: 
3 الوزن الناتج للمواد المحددة لا يتجاوز # 
4- الفائدة المكتسبة الناتجة أكبر ما يمكن. 
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f 
درسنا حلول هذه المسألة على حاسب متوازي متصل شجريا ومن ثم على حاسب متوازي مثصل‎ 


شبکیا. 


خوارزميات متوازية لأجهزة متعددة المعالجات ذات ذاكرة مشتركة: 


سنقوم فيما يلي بعرض بعض المسائل الشهيرة رياضيا » ونضمن التعاريف الخاصة بهاء ونضع 
خوارزميات الحلول التسلسلية والمتوازية لها » ونميز بين الخوارزميات المتوازية من أجل النماذج 
المختلفة للحواسيب وطرائق اتصالها في بعض منها » ومن ثم نعرض تحليلاً لكل منها لدراسة أمثليتها 
وكلفتها الزمنية وغيرها مع ذكر بعض الأمثلة التوضيحية. 


سنأخذ مسألتين من مسائل المقارنة مسألة الاختيار في سلسلة التي ظهرت في العديد من تطبيقات علوم 
الحاسبات والإحصاء» ومن ثم نأخذ مسألة أخرى تعرف بمسألة الدمج (لدمج متسلسلتين من البيانات 
لتشكيل متسلسلة ثالثة جديدة) وهي أحد مسائل المقارئة فقد ازداد الدمج في علم الحاسبات مع نتوع 
المحتويات متضمناً قواعد البيانات بشكل خاص وترتيب الملفات عموماً إذ أن العديد من هذه التطبيقات 
تستعمل مسألة الدمج للبيانات الرقمية ومن الضروري توظيف الدمج بشكل تام بحيث يحذف التكرار 
في الإدخالات من المتسلسلة الناتجة. 


مسألة الاخثيار: 

تحتوي دراستتا عن تحليل وتصميم الخوارزميات على المسألة التالية: 

لنأخذ سلسلة 8 من ۸ عنصر وعدد صحيح K‏ حيث ]>)>١‏ والمطلوب تحديد العنصر kK‏ الأصغر في 
8 //تعرف هذه المسألة بمسألة الاختيار |/. 

وغرضنا هنا هو إيجاد الخوارزمية المتوازية لحل هذه المسألة على حواسيب من النموذج 81۷0 
بذاكرة مشثركة. وسنصمم الخوارزمية بحيث تلائم عددأً من الأهداف ومن ثم نحللها لنتحقق من أن لك 
الأهداف ملائمة فعلا. 

تتتمي هذه المسألة إلى مجموعة مسائل تدعى مسائل المقارنة /كصعاا0إم «0وابوم۳هء/ حيث تحل 
هذه المسائل عادة عن طريق مقارنة أزواج من العناصر في سلسلة مدخلة. 

بدأنا في هذا المقطع بالتعريف النظامي لمسألة الاختيار وعرض الحد الأدنى لعدد الخطوات المطلوبة 
لحل المسألة على حاسب تسلسلي. وهذا يؤدي إلى الحد الأدنى لكلفة أي خوارزمية متوازية لمسألة 
الاختيار. عرضنا خوارزمية تسلسلية أمثلية وتتمثل أهداف تصميمنا على تحقيق الخواص المطلوبة 
بشكل عام في أية خوارزمية متوازية. ومن ثم قمنا بوصف خوارزمية الاختيار المتوازي وتحليلها. 
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مسألة الدمج: 


وهي أحد مسائل المقارنة ويمكن أن نعرفها كما يلي: لتكن إ,ط,.. ,)=8 , إيك,..,A=)4,32‏ 
متسلسلتين من الأرقام المرتبة تصاعدياً والمطلوب دمج كلا من المتسلسلتين 8 , 4 لتشكيل متسلسلة 
ثالثة ©: [يم0,..رد1.6] = € مرتبة تصاعدياً. حيث أن كل من العناصر في € نتتمي إما إلى ۸ 
أو إلى 8 وكل من العناصر به و إا تظهر مرة واحدة فقط في .C‏ 


شبكة الدمج: 


يمكننا أن نحصل على شبكة غرض خاص لإنشاء التوازي بأي من الطرق التالية: 

4- استعمال معالجات متخصصة مع شبكة الاتصالات التقليدية. 

5- استعمال شبكة اتصالات مصممة بشكل عادي لربط معالجات قياسية. 

6- استعمال خلیط من 1و2. 

سنأخذ في دراستنا لهذه المسألة الحالة الثالثة حيث سيتم الدمج عن طريق مجموعة من المعالجات 
البسيطة جداً متصلة بواسطة شبكة غرض خاص وهو البناء المتوازي وتعرف ب: 

/(r,s)-merging network/ (r,S) شبك لمج‎ 

إن جميع المعالجات المستعملة متماظة وتدعى المقارناث sإماوادمبه»ء.‏ يتلقى المقارن إدخالين 
ويصدر إخراجين كما يوضح الشكل (9-3). 


العنصر الأصغر بين × ور 


العنصر الأكبر بين × ور y‏ 


الشكل (9-3) يوضح دخل وخر ج المعالج المقارن 


العملية الوحيدة التي يستطيع المقارن إنجازها هي مقاردة قيم الإدخالين الخاصين به ومن ثم وضع 
الأصغر منهما في قمة خطوط الخرج والأكبر منهما في أسفلها. 

قمنا بداية بوصف بناء الشبكة الخاصة للدمج» ومن ثم أوجدنا خوارزمية متوازية تعمل على النموذج 
CORE ۷ SM 50D‏ وهي منكيفة وأمثظيةء وبما أن الخوارزمية تستخدم الخوارزمية التسلسلية للامج 
فقد قمنا بشرحها كإجراء. وهي توضح عمليات القراءة المتعددة التي يمكننا إزالتها من الخوارزمية 
المتوازية عن طرنيق المحاكاة على حاسب من النموذج ٤۷W‏ ۴8. وقد أوجدنا خوارزمية منكيفة وأمثلية 
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تعمل على النموذج EREW SM SMD‏ لها زمن تنفيذ أصغر من نلك المحاكاة وقد اعتمدت 
الخوارزمية على إجراء تسلسلي لإيجاد العنصر الأوسط في متسلسلتين مرتبتين. 


النتائج: 
" إن دراسة الخوارزميات المتوازية هذا الفرع الجديد من فروع المعلوماتية مسألة صعبة في وقتتا 


الراهن وخصوصاً لعدم توفر أجهزة ملائمة تسمح بترجمة الخوارزميات المقدمة في هذه الرسسالة 
إلى برامج عملية نتحقق من خلال تطبيقها على مسائل واقعية من أهمية النتائج التي يمكسن أن 
نتوصل إليها. 

بيتا في الفصل الأول من الرسالة مفهوم الأنظمة متعددة المعالجات وتعريفها وتصنيفها ودراسسة 
أسلوب التواصل فيها » كما قدمنا أفكاراً ونتائج تشكل أساسات نظرية الحساب المتوازي و وضحنا 
بعض نماذج الحساب المتوازي. 

درسنا في الفصل الثاني الخوارزميات المتوازية وأنواعها وميزنا خواصها وتقنيات تصسميمها 
ومقاييس تحليلها وتحديد كفاءتها. 

قدمنا في الفصل الثالث مسائل هامة وخوارزميات حلها بشكل متوازي وذلك بالاعتماد على أجهزة 
متعددة المعالجات »› ووجدنا أننا نستطيع باستخدام الخوارزميات المتوازية زيادة حجم المسائل 
الممكن حلها كما تساعد الخوارزميات المتوازية في الحصول على معلومات أكثر وحلول أفضل 
بنقليل الكلفة للمسائل كما وجدنا ضرورة تخصيص المعالجات بحجم كبير من العمل لاستثمار 
الحواسيب المتوازية بشكل أفضل. 

تسمح المسائل التي تمت معالجتها في هذا الفصل في توضيح أثر الموازاة في زيادة حجم المسائل 
التي يمكن حلها وتقليل زمن الوصول إلى الحل الأمثل إذ أن استخدام خوارزمية التحقق من 
الانتهاء يخبر بوصول مبكر للحل وبالتالي يؤدي إلى تقليل زمن النتفيذ. 


المقترحات والتوصيات: 


أقترح إجراء دراسة عامة وموسعة لكافة المسائل بالأسلوب المتوازي وفهم طرائق التعامل مع 
الأجهزة المتوازية وشبكات اتصالها لتحديد الخوارزميات المناسبة لحل المسائل. 

# تبين لنا أن المسألة الملحة الواجب معالجتها من وجهة نظر البرمجيات تكمن في تخصيص 
المهمات أو العمليات للمعالجات وتطرح هذه المسألة نفسها في الأجهزة المتعددة المعالجات 
ولابد من إجراء دراسات متعمقة في هذا المجال حتى نحصل على أفضل النتائج المأمولة من 
الموازاة في البرمجة. 
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*# أقترح الاستفادة من مفاهيم وخواص الخوارزميات المتوازية لوضع خوارزميات جديدة أو 
تطوير الخوارزميات القديمة لحل المساتل التي لا نعرف حلا عاماً لها. 

# أرى أن مشكلة نقل المعلومات التي ظهرت في مسالة البحث الشجري وتظهر في العديد مسن 
المسائل المشابهة ستبقى لمدة طويلة موضوع الساعة ومن المناسب التعمق في دراستها 
والبحث عن خوارزميات تسمح بمعالجتها وتعديلها وتطويرها. 
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Abstract 


Multitasking: 
Multitasking is the ability of the computation system to executing more than one 
task in the same time. 
The algorithm in the multiprocessor computers is built on the multitasking and 
the simultaneous executing. 
[SeGA-1989] Multitasking programming depends on the understanding of the 
method of executing instructions on data. A stream of instructions (the 
algorithm) tells the computer what to do at each step. A stream of data (the input 
of the algorithm) is affected by these instructions. 
We can distinguish among four classes of computers: 

1. SISD Computers: single instruction stream , single data stream 

2. MISD Computers: Multiple instruction stream , single data stream 

3. SIMD Computers: single instruction stream , Multiple data stream 

4. MIMD Computers: Multiple instruction stream , multiple data stream 


SIMD Computers: 


In the most interesting problems that we wish to solve on an SIMD Computers , 
jit is desirable for the processors to be able to communicate among themselves 
during the computation in order to exchange data or intermediate results. This 
can be achieved in two ways , giving rise to two subclasses : SIMD computers 
where communication is through a shared memory and those where it is done 
via an interconnection network. 
Shared- Memory (SM) SIMD Computers: 
[SeGA-1989] This class is also known in the literature as the Parallel Random — 
Access Machine (PRAM) model. 
During the execution of a parallel algorithm the N processors gain access to the 
shared memory. However , the class of shared- memory SIMD computers can be 
further divided into four subclasses, according to whether two or more 
processors can gain access to the same memory location simultaneously: 

1. Exclusive- Read , Exclusive- Write (EREW)SM SIMD Computers. 

2. Corcurrent- Read , Exclusive- Write (CREW)SM SIMD Computers. 

3. Exclusive - Read , Concurrent - Write (ERCW)SM SIMD Computers. 

4. Concurrent- Read , Concurrent - Write (CRCW)SM SIMD Computers. 


Interconnection- Network SIMD Computers: 

[SeGA-1989] This model is more powerful than the R-block shared memory ,„ aS 
it allows instantaneous communication between any pair of processors. Several 
pairs can thus communicate simultaneously (provided, of course, no more than 
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one processor attempts to send data to or expects to receive data from another 


processor). 


Simple Networks For SIMD Computers: 

The most popular of these networks are briefly outlined in what follows: 
(ll Linear Array: 
The simplest way to interconnect N processors is in the form of a one- 
dimensional array , as shown in Fig. 1.1 for N=6. Here , processor P; is 
linked to its two neighbors p;.ı and pj, through a two-way communication 
line. Each ofthe end processors , namely, pı and px , has only one neighbor. 


Figure 1.1 Linear array connection 


(i) Two-Dimensional Array: 
A two-dimensional network is obtained by arranging the N processors into an 
mxm array, where m=N"”, as shown in Fig 1.2 for m=4. 


Column 
nurmiber 0 1 2 د‎ 
Row nımher 
1 26 Pun 2 ّ Pus 
2 Pam ج د‎ 


Figure 1.2 Two- dimensional array (or mesh) connection 
(ii) Tree Connection: 


In this network , the processors form a complete binary tree. Such a tree has 
d levels , as shown in Fig. 1.3. 
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Level 


Level 


e 


Figure 1.3 Tree Connection 
(iv) Perfect Shuffle Connection: 
Let N processors Po,P1,...,Px.ı be available where N is a power of 2. In the 


perfect shuffle intercornection a one- way line links pi to pj „, where : 
1 21 for OSiSN/2-1I, 
ل‎ 


21+-1-N for N/2 < iS N-1, 
as shown in Fig. 1.4 for N=8. 


13 8 2 3 a 1 


Figure 1.4 Perfect Shuffle Connection 
(vy) Cube Connection: 


Assume that N= 2° for some q > 1 and let N processors be available 
PosP1-Px-1 . A q-dimensional cube (or hypercube) is obtained by connecting 
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each processor to q neighbors. This is illustrated in Fig. 1.5 for q=3 . The 
indices Of Po,P1,..,p7 are given in binary notation. 


Figure 1.5 Cube Connection for N=8 


Thesis of Parallel Computation: 

[MJQu,1994} It is well known that space and time are the two most important 
resources characterizing the complexity of sequential computation. Time is still 
important in parallel computations: the main reason for studying parallel 
computation is the attempt to "speed up" the solution of computational 
problems, and with more processing units available the time needed to solve a 
given problem will be less. This fact points at processing units as the second 
main requirement for parallel computation. 


Parallel Computations and Algorithmic Models: 
The Algorithmic Model: 
[MJQu,1994] The model is described by the following rules: 

1- at any instant „, any number of processors can be used; 

2- every processor can execute any operation (arithmetical or logical) in a 

unit of time; 

3- data access is at no cost; 

4A- communication among processors is at no cost, 
The crucial resources needed by the model are the number of parallel steps 
(number of time units) and the number of processors used , as a function of 
problem size, 


Boolean Circuits: 

[MJQu,1994] , [JIAJ,1992] The ordinary computers are paraliel machines. Each 
computer is , in fact, made of electronic circuits with millions of switching 
elements and transmission lines operating in parallel. Boolean circuits are a 
logic model of electronic circuits. 

The model works on problems represented by sequences of bits. All information 
entering and exiting a real computer is encoded in a sequences represent data 
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with sorne sort of structure, the meaning of a sequence depends on 
interpretation. 

Since operations are executed at the bit level, when an algorithm is expressed as 
a Boolean circuit its cost is called bit cost ( while its complexity is called bit 
complexity). 

This is a measure of parallel cost, In a sense, the above characteristics make the 
study of the complexity of parallel computations. 


The Parallel Algorithm: 

The parallel algorithm defines as a set of operations that each of it execut it's 
sequential algorithm and they are able to communicate among them selves by 
interconnection network. 

A parallel algorithm is a solution method for a given problem destined to be 
performed on a paralle! computer. In order to properly design such algorithms, 
one needs to have a clear understanding of the model of computation underlying 
the parallel computer. 


Analyzing Parallel Algorithms: 
[SeGA-1989] , [AnJe-1974] „ [GSAG-1994] The analyzing parallel algorithms 
determines how good an algorithm is, how fast, how expensive to run, and how 
efficient it is in its use of the available resources. It is usually evaluated using 
the following criteria: running time, number of processors used, and cost. 
1- Running Time: 
This is defined as the time taken by the algorithm to solve a problem on a 
parallel computer, that is, the time elapsed from the moment the algorithm 
starts to the moment it terminates. 
2- Number of processors: 
The second most important criterion ih evaluating a parallel algorithm is the 
number of processors it requires to solve a problem . it costs money tO 
purchase, maintain, and run computers. 
3- Cost: 
The cost of a parallel algorithm is defined as the product of the previous two 
measures; hence 
Cost = Parallel running, time x Number of processors used 
In other words „ cost equals the number of steps executed collectively by all 
processors in solving a problem in the worst case. This definition assumes 
that all processors execute the same number of steps. Jf this is not the case, 
then cost is an upper bound on the total number of steps executed. 


Designing Parallel Algorithms: 
{IFos-1994] , [{JeHk-1997] „ [BrCMal-1992] , [JHKi-1990] The most natural 
approach to developing parallel algorithms is to start from a sequential 
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algorithm, then to identify the independent steps, and finally to obtain a parallel 
version. 
This simple conversion from sequential to parallel often produces algorithms 
with a low degree of parallelism. Hence there arises the problem of determining 
strategies for obtaining efficient parallel algorithms. There is no general method 
for the best parallelization of a given problem. However, there are techniques 
that are successfully used in different problems. We will introduce a few widely 
applicable methods. 
1- Divide et impera: 
It consists of dividing the problem into subproblems of the same kind but of 
lesser size and then rearranging the solutions. This technique is sometimes 
very efficient. In fact, it allows us to express problems in terms of 
independent subproblems. These in turn can be solved in parallel, and their 
solution to the original problem. 
2- Vectorization: 
Vectorization is a technique that, starting from the analysis of a problem, 
produces algorithms working on data structures well suited for vector 
computations (typically vectors and matrices). 
3- Vector iterations: 
The method of vector iterations has been introduced by Traub and others for 
solving tridiagonal linear systems. Starting from a direct sequential method, a 
parallel iterative method is built. 
4 Recursive doubling: 
Recursive doubling consists of turning a computation graph such as the one 
shown in figure 2.1(a) into the graph shown in figure 2.1(b), it enables us to 
obtain a graph with logarithmic depth from a graph with linear depth. 


O 


ر ا 
0 ا کک 9 
vé AMS‏ 
7x‏ 
O O‏ 
N‏ 
O O‏ 
{b) logarithmic depth graph (a) linear depth graph‏ 
Figure 2.1‏ 
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Reducing the number of processors: 

Sometimes it is possible to reduce the order of magnitude of the number of 
processors used by a parallel algorithm by increasing the execution time by a 
constant factor. 


The Algorithm Cost: 

[WaCDak] , [FLCP-1993] , [JHro-1997]The cost is defined as the product of 
the number of processors used in the algorithm and the running time of the 
algorithm. 


The Comparison Of The Parallel Algorithms With The Sequential 
Algorithms: 

[RaRz-1993] , [JeHk-1997] The analysis of the algorithms declares in the 
comparison of the algorithms that dissolve the same problem. For any machine 
and for any programming language: 

Let us assume that we have two algorithms A and B. the two algorithms are 
executed the same problern. We want to know that the algorithm A is better than 
the algorithm B. 


Parallel Algorithms To Solve Some Problems On Multiprocessors 
Computers: 


Broadcast Algorithm: 

Let D be a location in memory holding a datum that all N processors need at a 
given moment during the execution of an algorithm. This is a special case of the 
more general rmultiple-read situation and can be simulated on an EREW 
computer by broadcasting process. We gave this process formally as procedure 
BROADCAST. 


The Supervision Of The Termination: 

Sometimes we need to know whether the processors are done its work or not. A 
location F holding a Boolean value can be set aside in the shared memory to 
signal that one of the processors has terminated and, consequently, that all other 
processors should terminate their work. Initially , F is set to false when a 
processor terminate it's work it sets F to true. At every step of the work all 
processors check F to see if it is true and stop if this is the case, When we work 
on the EREW model this process log N steps are needed to broadcast the value 
of F each time the processors need it. This lead to increase the running time. In 
the CREW SM SIMD computer, since concurrent-read operations are allowed, it 
takes one step for all processors to read F and this decrease the running time. 
Finally we note that sometimes more than one processor terminate its work in 
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the same time and hence more than one processor may need to report success at 
the same time. This means that two or more processors will attempt to write into 
location F simultaneously, a situation that can only be handled by a CREW SM 
SIMD computer. 


Searching On A Tree: 
[GC.O,1993], [KMJm,1982] , [(CSJJ,1981] Searching is one of the most 
fundamental operations in the field of computing. It is used in any application 
where we need to find out whether an element belongs to a list or, more 
generally, retrieve from a file information associated with that element. In its 
most basic form the searching problem is stated as follows: Given a sequence S 
=  81,82,..,8,} Of integers and an integer x, it is required to determine whether x 
= s, for some s, İn S. 
In sequential computing , the problem is solved by scanning the sequence S and 
comparing x with its successive elements until either an integer equal to x is 
found or the sequence is exhausted without success. A tree- connected SIMD 
computer with n İeaves is available for searching a file of n records. Each leaf of 
the tree stores one record of the file to be searched. The root is in charge of 
receiving input from the outside world and passing a copy of it to each of its two 
children . it is also responsible for producing output received from its two 
children to outside world. As for the termediate nodes, each of these is capable 
of: 

1- receiving one input from its parent, making two copies of it, and sending 

one copy to each of its two children ; and 
2- receiving two Inputs from its children, combining them, end passing the 
result to its parent. 


¢ Inputoutput 


Intermediate 


Figure 3.2 Tree-connected computer for searching 
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Parallel Algorithms Applications: 
In this section it is shown some of decision and optimization problems 
applications that used efficient parallel algorithms such as computing prefix 
sums. We use the problems of job sequencing with deadlines which is decision 
problem and knapsack problem which is optimization one. 
In the two problems there are an algorithm on parallel computer with tree- 
connection and each of them used computing prefix sums. Since it is shown 
several computer models. 

- SEQUENTIAL SUMS (for the sequential case). 

- PARALLEL SUMS (for multiprocessor computer). 

- ALLSUMS (for computing all sums) 

- Prefix sums of a tree 

- Prefix sums of mesh 


Job Sequencing with deadline: 

A set of n jobs J = {jo,j1,..,jn-1} is given to be processed on a single machine. The 
machine can execute one job at a time , and when it is assigned a job, it must 
complete it before the next job can be processed. With each job j, is associated: 
(i) a processing t; and 

(i1) a deadline d; by which it must be completed. 

A schedule is a permutation of the jobs ir J that determines the order of their 
execution . a schedule is said to be feasible if each job finishes by its deadline. 
The question is: Given n jobs {jo,j1,..,ja.ı} with processing time {to,t1,.,tn-1} and 
deadlines {do,dı,..,d,.1} , does a feasible schedule exist? It turns out that this 
question can be answered in the affirmative if and only if any schedule where 
the jobs are executed in nondecreasing order of deadlines is feasible. Therefore , 
to solve the problem, it suffices to arrange the jobs in order of nondecreasing 
deadlines and test whether this yields a feasible schedule. In case it does , we 
know that the answer to the question is yes, otherwise the answer is no. 
sequentially ,this algorithm requires O(n log n) time to sort the jobs and then 
O(n) time to test whether each job can be completed by its deadline. 


The Knapsack Problem: 
[MLFi,1981], [WShi,1979} , [DFGP,1982]We are given a knapsack that 


can carry a maximum weight of W and a set n objects A™{4),8;,..,a,.ı} whose 
respective weights are {Wo,W1,..Wr-1} associated with each object is a profit, the 
set of profits being denoted by {pPo,P1,..,Pa-1}. If we place in the knapsack a 
function z; of the object whose weight is w; , where 0 < z; < 1, then a profit of 
zp; is gained. Our purpose is to fill the knapsack with objects (or fractions 
thereof) such that 
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(D the total weight of the total weight of the selected objects does not 
exceed W and 

(il) the total profit gained is large as possible. We have dissolved this 
problem on parallel computer with tree- connection and on a mesh- 
connection parallel computer. 


Parallel Algorithm On Multiprocessors Computer With Shared 
Memory: 

Our study begins by showing some famous problems and enclose their 
definitions and its sequential and parallel algorithms for several models of 
computer and its connection-models. Since, it is shown an analysis of each 
algorithm for study its efficiency and its time cost with some examples. 

We will have two problems of comparison problems. The first is known as the 
selection problem. It rises in many applications in computer science and 
statistics. The second is that of merging. Which belongs to comparison 
problems. In computer science, merging arises in a variety of contexts including 
database applications in particular and the file management in general. Many of 
these applications „, of course, involve the merging of nonnumeric data. 
Furthermore, it is often necessary once the merging is complete to delete 
duplicate entries from the resulting sequence. 


Selection Problem: 

Our study of parallel algorithm design and analysis take in the following 
problem: 

Given a sequence S of n elements and an integer k, where 15 k <“ n , if is 
required to determine the k th smallest element in S. this is known as the 
selection problem, It arises in many applications in computer science and 
statistics. Our purpose is to present a parallel algorithm for solving this problem 
on the shared-memory SIMD model. The algorithm will be designed to meet a 
number of goals, and our analysis will then confirm that these goals have indeed 
been met. This problem belongs to family of problems known as comparison 
problems. These problems are usually solved by comparing pairs of elements of 
an input sequence. We start in this section by the selection problem formally and 
deriving a lower bound on the number of steps required for solving it on a 
sequential computer, This translates into a lower bound on the cost of any 
parallel algorithm for selection. An optimal sequential algorithm is presented. 
Our design goals are stated in the form of properties generally desirable in any 
parallel algorithm. Since, there are the parallel selection algorithm and its 
analysis. 
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Merging problem: 
This problem belongs to a class of problems known as comparison problems. It 
is defined as follows : 
let A={3,81,..,3,-1} and B={bo,bı,..,D,.ı} be two sequences of numbers sorted in 
non decreasing order ; it is required to merge A and B , that is, to form a third 
sequence C = {Cg,C1,..,Crrs} , also sorted in nondecreasing order, such that each Ci 
in C belongs to either A or B and each a; and b; appears exactly once in C. 
A Network For Merging: 
We saw that special-purpose parallel architectures can be obtained in any one of 
the following ways: 

() using specialized processors together with a conventional 

interconnection network, 
(i) using a custom-designed interconnection network to link standard 
processors, Or 

(iii) using a combination of (i) and (11). 

We shall take the third of these approaches. 
Merging will be accomplished by a collection of very simple processors 
communicating through a special-purpose network. This special-purpose parallel 
architecture is known as an (r,s)-merging network. All the processors to be used 
are identical and are called comparators. As illustrated by Fig 3.9. 


Smaller ef x and y 
y Larger of x and y 


Figure 3.9 comparator 


The only operation a comparator is capable of perfoming is to compare the 
values of its two inputs and then place the smaller and larger of the two on its 
top and bottom output lines, respectively. 

We begin by describing a special-purpose parallel architecture for merging. A 
parallel algorithm for the CREW SM SIMD model is presented that is adaptive 
and cost optimal. Since the algorithm invokes a sequential procedure for 
merging , that procedure is also described. It is shown how the concurrent- read 
operations can be removed from the parallel algorithm by simulating it on an 
EREW computer. Finally, an adaptive and optimal algorithm for the EREW SM 
SIMD model is presented whose running time is smaller than that of the 
simulation. The algorithm is based on a sequential procedure for finding the 
median of two sorted sequences also described. 
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The Results: 

- The study of the parallel algorithms this new subclass of the informatics 
subclasses is a difficult problem in the actual time especially because 
there isn't acceptable machines that allow off compiler the given 
algorithms in this study to have practical programs and when we 
execution it on factual problems we materialize the pith of the results that 
possibly we access İt. 

~ We have explained in the first chapter the intension of the multiprocessors 
systems and their definition, classification, and the study of how their 
connection. As we have introduced results and ideas about the theory of 
parallel computation, with some models of parallel computation. 

~- We have studied in the second chapter the parallel algorithms and their 
kinds, properties, design techniques, analysis measures, and cost 
limitation. 

- We have introduced in the third chapter a crucial problems and their 
parallel algorithms on multiprocessors computers. The parallel algorithms 
help in recurrence more information and best solution in decreasing the 
cost of the problems. This problems give Hiberally to illustration the touch 
of the parallelism in increasing the size of problems that can solve and 
decreasing the optimal solution that is the algorithm of supervision of the 
termination reports an early access to the solution, thus, conducts tO 
decreasing the running tirme. 


The Proposals And The Recommendations: 

- 1I suggest proceeding gross study for all the problems in the parallel 
system, and understanding the methods of parallel computers and their 
connection networks for allocation the suitable algorithms for solve this 
problems. 

- Essential proceeding profound studies for destination the processes to the 
processors to have the best results from the parallel programming. 

- Developing the ancient algorithms to solve the problems that there are not 
gross solutton for them. 

- Putting a through study for the transport of the information problem and 
search for algorithms that allow in treatment, change, and developing 
them. 
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المساعد لبرنامج دمج مصفوفتين 


آلية استخدام البرنامج: 


- ندخل بعد المصفوفة الأولى في المربع 1 
- یتفعل زر إدخال قیم ۸ 
- ندخل قيم المصفوفة 4 في المربع 2 


- تظهر قيم المصفوفة ۸ مرتبة بشكل تلقائي في المربع 3 كما في الشكل التالي: 
س س 
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&ar, int &d, int &X} 


CVBBounds () } 


"عنصر هكذا! يوجد 


CFormi::divary{ CVBArray<int> 
أ‎ 


CVariant Ti 7; 
CVariant Tj ; 
CVariant TIN ¢; 
‘BYTE TM = QO; 
CVBArray<int>TA {(CVEBounds (S50 J, 
CVariant vbOKOniy ; 


IMs d7 2 + 1; 


و (["موجود العنصر ")×80 Msg‏ 


A 


Tj = 0O; 
TN = d; 
E ( d == Û }) { 
MsgBox ("YY 
retürn; 
1 
if ( %4 == Û & ar { 
MsgBox ("YY 
return; 
1 
TM = d $ 2; 
گ1‎ {( TM == 1} [{ 
f { ar {( TM) == X } { 
return; 
} 
else 1 
d = d 
if N SAET QY I 


for (Ti=0; Ti<=(CVariant) (d - 1}; Ti++} 
TA { Tj} = ar ({( Ti}; 


J) { 


Tj = Tj + ({CVariant) (1l)? 
} 


divary ( TempLocn { TA}, d, X}; 


ر 
else if ( XK == ar ( dJ)‏ 


و ("موجود العنصر ")×g80وMs‏ 


return? 


} 
else if ( X> ar ( d) } 


for ({(Ti=d + 1; Ti<=TN; Ti++} { 
TA { Tj) = ar ( Ti}? 
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Tj = Tj + (CVariant) {1}; 
} 
divary { TempLocn ( TA), d, XK); 
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else 
15380× )" ("موجود العنصر‎ 7 
return; 


} 


1 
elise 1 
d= d 7/2; 
if ( XX < ar { dd} }J { 
for (Ti=O0; Ti<=(CVariant) (d = 1l}; Tir} { 
TA { Tj} = ar ( Tİ)}; 
Tj = Tj + {CVariant) (1)7 


} 
divary ( TempLocn ( TA}, dr, XX}; 


} 
else if ( KX == ar ( d} ) { 
Msg80xX )" ۾ ("موجود العتصر‎ 


} 
else if {XK > ar ( d) )} { 
for ({(Ti=d + 1l; TI<=TIN; Tie} { 
TA ( Tj) = ar ( Ti}; 
Tj = Tj + (CVariant) (i); 


} 
divary { TerpLocn { TA}, d, XJ; 
} 


else {‏ 
۾ ("موجود العتصر MsgBox)"‏ 
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